Effectuer une requete

Votre premiere requete API a AWS Bedrock necessite trois composants essentiels : un client Bedrock Runtime, un identifiant de modele, et un message utilisateur.

Configurer le client Bedrock

Commencez par creer un client avec boto3 :

import boto3

client = boto3.client("bedrock-runtime", region_name="us-west-2")

Identifiants de modeles et disponibilite regionale

Tous les modeles ne sont pas disponibles dans toutes les regions AWS. Si vous essayez d’utiliser un modele qui n’existe pas dans votre region, vous obtiendrez une erreur cryptique.

Profils d’inference

Les profils d’inference resolvent le probleme de disponibilite regionale en routant automatiquement vos requetes vers une region ou le modele est effectivement heberge. Au lieu de suivre manuellement quels modeles sont dans quelles regions, vous utilisez un profil d’inference qui gere le routage.

Pour trouver les identifiants de profils d’inference, allez dans la console AWS Bedrock et regardez sous “Cross-region inference”.

Creer des messages utilisateur

Les messages utilisateur ont une structure specifique :

user_message = {
    "role": "user",
    "content": [
        {"text": "Combien font 1+1 ?"}
    ]
}

Le contenu est une liste car un seul message peut contenir differents types de contenu (texte, images, etc.).

Effectuer la requete

Appelez l’API avec la methode converse :

response = client.converse(
    modelId=model_id,
    messages=[user_message]
)

Pour extraire le texte genere :

response["output"]["message"]["content"][0]["text"]

Types de messages

Deux types principaux :

Messages utilisateur (role: "user") : contenu que vous envoyez au modele
Messages assistant (role: "assistant") : contenu que le modele a produit

Les deux suivent la meme structure avec un role et une liste de contenu, ce qui facilite le chainage de requetes pour des conversations plus longues.