View a markdown version of this page

Cotas do Amazon Bedrock - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Cotas do Amazon Bedrock

Você Conta da AWS tem cotas padrão, anteriormente chamadas de limites, para o Amazon Bedrock. Para visualizar as cotas de serviço do Amazon Bedrock, execute um dos seguintes procedimentos:

No Amazon Bedrock, a inferência do modelo é controlada por cotas de uso de tokens. Alguns modelos usam tokens em uma taxa mais alta. Para ter mais informações sobre essas taxas e como otimizar o uso de tokens, consulte Como os tokens são contados no Amazon Bedrock.

O Amazon Bedrock oferece dois endpoints de inferência — bedrock-runtime e bedrock-mantle — cada um com suas próprias alocações de cotas por modelo. O tráfego para os dois endpoints é rastreado com base em cotas separadas, mesmo ao chamar o mesmo modelo subjacente. Para obter mais detalhes, consulte Cotas para o endpoint de tempo de execução básico e Cotas para o endpoint rocho-mantle.

Para manter o desempenho do serviço e garantir o uso adequado do Amazon Bedrock, as cotas padrão atribuídas a uma conta podem ser atualizadas dependendo de fatores regionais, histórico de pagamentos, uso fraudulento e and/or aprovação de uma solicitação de aumento de cota.