SEO

Rag: Les spécialistes du marketing d’outils d’IA les plus importants n’ont jamais entendu parler de Vertesia

À l’heure actuelle, la plupart des spécialistes du marketing ont au moins taillé avec des outils génératifs de l’IA (Genai) et des modèles de grands langues (LLMS) comme Chatgpt, Claude et Gemini. Ils ont entendu dire que leurs concurrents utilisent la technologie pour créer pratiquement des campagnes entières en appuyant sur un bouton. Et ils sont conscients que l’IA remodèle le marketing et sont peut-être à la fois excités et un peu inquiets de ce que l’avenir apportera.

À ce jour, une grande partie de la conversation précoce sur la mise en production de l’IA à grande échelle s’est concentrée sur la nécessité d’une bonne ingénierie rapide – la possibilité de poser les bonnes questions de cette technologie puissante. On nous a dit que notre utilisation réussie de la technologie dépend de cette compétence, avec l’implication que nous pouvons nous sortir du problème.

Alors que des organisations comme les grandes entreprises technologiques et les laboratoires AI sont occupés à embaucher des ingénieurs rapides, une grande partie de l’accent mis sur l’ingénierie rapide est un holdover dès les tout premiers jours du Genai, lorsque la familiarité avec les limites de longueur de jeton, les bizarreries du comportement et les méthodes pour éviter les hallucinations était un licorne. Aujourd’hui, «l’ingénierie rapide» n’est souvent qu’un nom sophistiqué pour donner à un modèle d’IA de meilleures instructions plus explicites.

Assistance rapide basée sur le chat

Et, comme illustré ci-dessus, même les LLM deviennent assez bons pour écrire des invites efficaces.

La vérité est que l’ingénierie rapide est importante, mais même les meilleures invites ne peut pas Surmonter les limites de Genai sans chiffon.

Qu’est-ce que le chiffon – et pourquoi est-ce important?

La génération, ou RAG, de récupération, consiste à fournir des modèles Genai avec un contexte externe – des données ou du contenu soigneusement sélectionnés – pour produire des sorties plus précises, pertinentes et ciblées.

L’un des plus grands défis avec les modèles Genai est qu’ils fourniront toujours une réponse, qu’ils aient reçu le bon contexte ou des intrants de haute qualité. Sans des données suffisantes, ils produisent fréquemment des sorties convaincantes mais inexactes (hallucinations) ou des résultats génériques hors marque qui ne sont pas adaptés à l’usage. Le chiffon aborde directement ce problème.

Pour comprendre le chiffon sous sa forme la plus simple, pensez à votre modèle Genai comme une nouvelle location de nouveau-noyau, une ressource avec un potentiel, des compétences et des connaissances générales énormes, mais manque de connaissances spécifiques de votre entreprise. RAG agit comme le processus d’intégration crucial – équiper votre «nouvelle location» de l’IA avec un contexte organisationnel précis, des directives de marque, des politiques et, peut-être le plus critique, des ressources ciblées et des informations de référence. Cette «intégration» transforme les capacités de base de vos «nouveaux accusés» en sorties précises, ciblées et alignées sur la marque, faisant de RAF une base essentielle pour les entreprises s’appuyant sur Genai pour fournir des résultats critiques.

Tout commence par des données

Il y a quelques années à peine, nous avons supposé que le seul moyen d’obtenir des résultats précis et pertinents de Genai était de développer des modèles personnalisés. Cette approche, cependant, sous-estime considérablement le temps, la complexité, le coût et l’expertise impliqués. Le chiffon représente une alternative viable et rentable.

Mais d’abord, vous devez avoir un ensemble optimisé de données. Pour les cas d’utilisation marketing traditionnels basés sur le texte, vous devez organiser une collection de contenu marketing existant qui représente le mieux votre marque, votre ton de voix et la façon dont vous structurez généralement différents types de garantie et de communication. Ce contexte permettra à un modèle Genai de produire des résultats qui nécessitent une revue minimale et une intervention humaine. Cependant, il y a deux défis de base ici:

  1. Les données d’entrée de chiffon doivent être lisibles par machine. Les modèles Genai fonctionnent bien avec un contenu à une seule page, mais ont tendance à lutter avec des documents plus longs et plus complexes, comme les Blancapers, qui intégrent généralement des graphiques, des images, des graphiques et peut-être même des données tabulaires. Vous devez préparer correctement ces documents longs pour l’ingestion d’un LLM.
  2. Les données de chiffon doivent être interrogables avec précision. Un aspect très puissant du RAG est la «récupération» dynamique des données pertinentes. Cependant, l’utilisation efficace du RAG dépend de la possibilité de récupérer exactement les informations que vous souhaitez alimenter sur votre modèle – rien de plus et rien de moins.

En bref, pour tirer le meilleur parti du chiffon, vous avez besoin de données qui sont à la fois bien structurées et bien marquées.
Une approche pour répondre à ce besoin est appelée «superposition sémantique» – une représentation précise et structurée d’un document, avec des tables, des extractions de données pour les graphiques et les graphiques, des données tabulaires et même des descriptions détaillées d’images intégrées. XML est un format préféré car il est à la fois facile pour les modèles Genai de comprendre et fournit un étiquetage étendu pour les requêtes de document. Un autre avantage d’une couche sémantique est qu’elle peut être réutilisée sur plusieurs cas d’utilisation et les applications Genai.

Femme au bureau travaillant sur un ordinateur portable

Comme je l’ai discuté dans mon dernier article Martech, il existe également un certain nombre de cas d’utilisation convaincants de Genai liés au travail avec des graphiques, des images et d’autres actifs numériques. L’exigence de RAG est à peu près la même ici – vous avez besoin d’entrées bien marquées avec des données significatives et structurées qui peuvent être facilement interrogées. Par exemple, si vous souhaitez utiliser Genai pour l’enrichissement des actifs en utilisant votre propre taxonomie ou votre ontologie et vos métadonnées uniques (par exemple, ID de produit, schémas de couleurs, etc.), vous devez être en mesure de fournir le modèle avec le bon contexte pour identifier avec précision le contenu de l’image et générer les métadonnées correspondantes.

J’ajouterais que si les modèles Genai commerciaux peuvent généralement identifier des attributs d’image simples – comme reconnaître qu’une image contient des gens, un chapeau ou une voiture – ils ne parviennent généralement pas à capturer l’esthétique de la marque nuancée, les références culturelles, le ton ou la résonance émotionnelle. Les spécialistes du marketing et les professionnels de la création ont besoin de métadonnées d’actifs beaucoup plus rigoureuses et détaillées qui s’alignent sur une vision et une voix de marque très spécifiques.

En termes simples, la mise en œuvre de RAG pour les actifs visuels exige une conservation réfléchie et un étiquetage détaillé des métadonnées des images et des vidéos, un raffinement continu des données de formation visuelle et une gestion minutieuse pour garantir que les résultats restent alignés sur l’évolution des stratégies créatives et des normes de marque.

Faire faire attention à Genai

L’une des caractéristiques puissantes de RAG est que la récupération (le «R» en chiffon) est dynamique, pas statique. Afin de remplir votre entrée de chiffon, vous exécutez une recherche dynamique basée sur un ensemble donné de paramètres pour récupérer les informations les plus pertinentes et les plus à jour.

Cependant, un problème sous-estimé avec la plupart des modèles Genai est la fenêtre de contexte limité. Les modèles ont des limites (mesurées en jetons) sur la quantité d’informations qu’ils peuvent traiter et comprendre en même temps. Considérez-le comme la mémoire à court terme ou la mémoire de travail du modèle. Une fois que vous avez dépassé la fenêtre de contexte, un modèle commencera à perdre la trace de l’entrée antérieure, affectant la qualité de la sortie. En raison de cette limitation, les spécialistes du marketing ne peuvent pas simplement jeter des centaines de documents ou des milliers d’images à un modèle avec RAG et s’attendent à ce qu’il produise les résultats souhaités.

La préparation des données vous permet d’être très sélective avec la récupération. Certains peuvent contester la supériorité d’une technique de recherche sur un autre, par exemple, le graphique est meilleur que la recherche vectorielle (sémantique), ou vice versa. Mais je crois qu’aucune technique n’est intrinsèquement meilleure qu’une autre, et souvent, les meilleurs résultats proviennent des techniques de combinaison. Quoi qu’il en soit, sans préparation de données de qualité, aucune recherche ne sera terriblement précise.

Pour être efficace avec RAG, vous devez être en mesure d’interroger un grand ensemble d’informations et de sélectionner uniquement les données nécessaires pour fournir le bon contexte pour le modèle. Si vous ne pouvez pas être sélectif dans votre récupération, vous risquez de dépasser la fenêtre de contexte (généralement 100 000 à 300 000 jetons) ou, pire encore, vous fournissez les mauvaises entrées et contextes au modèle, et la qualité de vos résultats souffre. (Pour référence, une page de texte est d’environ 400 à 500 jetons.)

La meilleure façon de gérer les fenêtres de contexte limité de Genai est de commencer par un ensemble de données bien préparé et d’être très précis, très ciblé avec votre récupération.

Alléger la charge avec des agents intelligents

Si tout cela ressemble à un soulèvement lourd, cela peut certainement l’être. Une récente enquête a révélé que jusqu’à 50% du temps consacré à la construction de nouvelles applications / agents Genai était attribué à la préparation des données. Cependant, il y a de l’espoir. Récemment, les gens ont commencé à tirer parti des agents LLMS et Genai pour automatiser la préparation des données et créer des couches sémantiques.

Avec une simple invite, les flux de travail agentiques peuvent agir de manière autonome et utiliser divers outils et techniques pour accéder et récupérer les entrées de chiffon précis nécessaires pour générer la meilleure réponse pour une tâche ou une activité donnée. Cette approche offre deux avantages critiques:

  • Il permet aux utilisateurs non techniquescomme les spécialistes du marketing et les professionnels de la création, pour tirer parti sans effort l’IA génératrice pour des projets sophistiqués, réduisant considérablement la complexité et les courbes d’apprentissage.
  • Il automatise les processus à forte intensité de main-d’œuvrecomme la préparation des données, améliorant considérablement la qualité des sorties Genai et accélérant le temps à valeur pour les nouvelles applications Genai.

Tout cela est pourquoi, dans mon article précédent, j’ai fait valoir que Genai n’est pas «plug and play» – il y a des complexités plus profondes et que le chiffon en est un. Mais il existe des outils et des plateformes qui rendent ce voyage plus rapide et plus facile, aidant à créer des applications et des agents Genai personnalisés sans les coûts et les complexités inhérents.

Cela ne suggère pas que RAG donnera immédiatement un accès aux campagnes de marque à bouton-poussoir, du moins pour l’instant. Mais RAG présente l’occasion de réutiliser les actifs marketing existants de manière à créer une nouvelle valeur pour très peu d’efforts – et d’une manière qui conserve l’identité et la voix de la marque que les spécialistes du marketing ont travaillé si dur pour établir.

En savoir plus sur le chiffon agentique avec Vertésia.

Écrit par Chris McLaughlin, directeur du marketing à Vertesia

Author

Boosteseo

Leave a comment