Effectuer une requete
Votre premiere requete API a AWS Bedrock necessite trois composants essentiels : un client Bedrock Runtime, un identifiant de modele, et un message utilisateur.
Configurer le client Bedrock
Commencez par creer un client avec boto3 :
import boto3
client = boto3.client("bedrock-runtime", region_name="us-west-2")
Identifiants de modeles et disponibilite regionale
Tous les modeles ne sont pas disponibles dans toutes les regions AWS. Si vous essayez d’utiliser un modele qui n’existe pas dans votre region, vous obtiendrez une erreur cryptique.
Profils d’inference
Les profils d’inference resolvent le probleme de disponibilite regionale en routant automatiquement vos requetes vers une region ou le modele est effectivement heberge. Au lieu de suivre manuellement quels modeles sont dans quelles regions, vous utilisez un profil d’inference qui gere le routage.
Pour trouver les identifiants de profils d’inference, allez dans la console AWS Bedrock et regardez sous “Cross-region inference”.
Creer des messages utilisateur
Les messages utilisateur ont une structure specifique :
user_message = {
"role": "user",
"content": [
{"text": "Combien font 1+1 ?"}
]
}
Le contenu est une liste car un seul message peut contenir differents types de contenu (texte, images, etc.).
Effectuer la requete
Appelez l’API avec la methode converse :
response = client.converse(
modelId=model_id,
messages=[user_message]
)
Pour extraire le texte genere :
response["output"]["message"]["content"][0]["text"]
Types de messages
Deux types principaux :
- Messages utilisateur (
role: "user") : contenu que vous envoyez au modele - Messages assistant (
role: "assistant") : contenu que le modele a produit
Les deux suivent la meme structure avec un role et une liste de contenu, ce qui facilite le chainage de requetes pour des conversations plus longues.