
Google a récemment déposé un nouveau brevet pour un moyen de fournir des résultats de recherche en fonction de la navigation et de l’historique des e-mails d’un utilisateur. Le brevet décrit une nouvelle façon de rechercher dans le contexte d’un moteur de recherche, dans une interface par e-mail et via un assistant vocal (appelé dans le brevet comme un système de dialogue vocal).
Un problème que beaucoup de gens ont est qu’ils peuvent se souvenir de ce qu’ils ont vu, mais ils ne se souviennent pas où ils l’ont vu ni comment ils l’ont trouvé. Le nouveau brevet, intitulé Génération de réponses de requête à partir de l’historique d’un utilisateur, résout ce problème en aidant les gens à trouver des informations qu’ils ont déjà vues dans une page Web ou un e-mail en leur permettant de demander ce qu’ils recherchent en utilisant un langage quotidien, tel que «quel était cet article que j’ai lu la semaine dernière sur les échecs?»
Le problème que l’invention résout est que les moteurs de recherche traditionnels ne permettent pas aux utilisateurs de rechercher facilement leur propre navigation ou l’historique des e-mails en utilisant le langage naturel. L’invention fonctionne en prenant une question parlée ou dactylographiée d’un utilisateur, reconnaissant que la question est de demander du contenu précédemment vu, puis de récupérer les résultats de la recherche de l’historique personnel de l’utilisateur (comme l’historique ou les e-mails de son navigateur). Pour ce faire, il utilise des filtres comme la date, le sujet ou l’appareil utilisé.
Ce qui est nouveau dans l’invention, c’est la capacité du système à comprendre des requêtes vagues ou floues en langage naturel et à les faire correspondre aux interactions passées spécifiques d’un utilisateur, notamment en montrant la version d’une page telle qu’elle regardait lorsque l’utilisateur l’a vu à l’origine (une version mise en cache de la page Web).
Classification de requête (intention) et filtrage
Classification des requêtes
Le système détermine d’abord si l’intention de la requête parlée ou dactylographiée de l’utilisateur est de récupérer des informations précédemment consultées. Ce processus est appelé classification des requêtes et implique l’analyse de la phrasé de la requête pour détecter l’intention. Le système compare des parties de la requête aux modèles connus associés aux questions de recherche d’histoire et utilise des techniques telles que l’analyse sémantique et les seuils de similitude pour identifier si l’intention de l’utilisateur est de rechercher quelque chose qu’ils avaient vu auparavant, même lorsque le libellé est vague ou conversationnel.
Le seuil de similitude est une partie intéressante de l’invention car elle compare ce que l’utilisateur dit ou tape à des phrases connues de recherche d’histoire pour voir si elles sont similaires. Il ne cherche pas un match exact mais plutôt un match serré.
Filtration
La partie suivante est le filtrage, et cela se produit après que le système a identifié l’intention de recherche d’historique. Il applique ensuite des filtres tels que le sujet, le temps ou l’appareil pour limiter la recherche au contenu de l’historique personnel de l’utilisateur qui correspond à ces critères.
Le filtre à l’heure est un moyen de contraindre la recherche dans un délai spécifique mentionné ou implicite dans la requête de recherche. Cela aide le système à réduire les résultats de recherche à ce que l’utilisateur essaie de trouver. Donc, si un utilisateur parle de phrases comme «la semaine dernière» ou «il y a quelques jours», il sait restreindre la requête à ces délais respectifs.
Une qualité intéressante du filtre à temps est qu’elle est appliquée avec un niveau de flou, ce qui signifie qu’il n’est pas exact. Ainsi, lorsqu’une personne demande à l’assistant vocal de trouver quelque chose de la semaine dernière, il ne fera pas de recherche littérale des sept derniers jours, mais l’élargira à une plus longue période.
Le brevet décrit la qualité floue du filtre à temps:
«Par exemple, la collection d’historique du navigateur… peut inclure une liste de pages Web accessibles par l’utilisateur. Le moteur de recherche… peut obtenir des documents de l’index… en fonction des filtres à partir de la requête formatée.
Par exemple, si la requête formatée… comprend un filtre de date (par exemple, «la semaine dernière») et un filtre de sujet (par exemple, «histoire d’échecs»), le moteur de recherche… ne peut récupérer que des documents de la collection… qui satisfont ces filtres, c’est-à-dire des documents auxquels l’utilisateur accédé la semaine précédente qui se rapporte à une «histoire d’échecs».
Dans cet exemple, le moteur de recherche… peut appliquer des gammes de temps floues au filtre «la semaine dernière» pour tenir compte des inexactitudes dans la mémoire humaine. En particulier, bien que «la semaine dernière» se réfère littéralement aux sept jours civils de la semaine précédente, le moteur de recherche… peut rechercher des documents sur une gamme plus large, par exemple, à tout moment au cours des deux dernières semaines. »
Une fois qu’une requête est classée comme demandant quelque chose qui a été vu auparavant, le système identifie les détails de la phrasé de l’utilisateur qui indiquent le sujet, la date ou l’heure, la source, l’appareil, l’expéditeur ou l’emplacement et les utilisent comme filtres pour rechercher l’historique personnel de l’utilisateur.
Chaque filtre aide à réduire la portée de la recherche pour correspondre à ce que l’utilisateur essaie de rappeler: par exemple, un filtre de sujet («recette de dinde») cible le sujet du contenu; Un filtre à temps («la semaine dernière») restreint les résultats à son accession; Un filtre source («Whitehouse.gov») limite la recherche sur des sites Web spécifiques; Un filtre d’appareil (par exemple, «sur mon téléphone») restreint en outre les résultats de recherche d’un certain appareil; Un filtre de l’expéditeur («From Grandma») aide à localiser les e-mails ou le contenu partagé; et un filtre de localisation (par exemple, «au travail») restreint les résultats à ceux accessibles dans un lieu physique particulier.
En combinant ces filtres sensibles au contexte, le système imite la façon dont les gens se souviennent naturellement du contenu afin d’aider les utilisateurs à récupérer exactement ce qu’ils recherchent, même lorsque leur requête est vague ou incomplète.
Portée de la recherche: ce qui est recherché
La partie suivante du brevet consiste à déterminer la portée de ce qui va être recherché, ce qui est limité à des sources prédéfinies telles que l’historique du navigateur, les versions mises en cache des pages Web ou les e-mails. Ainsi, plutôt que de rechercher le Web entier, le système se concentre uniquement sur l’historique personnel de l’utilisateur, ce qui rend les résultats plus pertinents pour ce que l’utilisateur essaie de rappeler.
Versions mises en cache du contenu précédemment vu
Une autre fonctionnalité intéressante décrite dans le brevet est la mise en cache de la page Web. La mise en cache fait référence à l’enregistrement d’une copie d’une page Web telle qu’elle est apparue lorsque l’utilisateur l’a vu à l’origine. Cela permet au système d’afficher l’utilisateur cette version spécifique de la page dans les résultats de recherche, plutôt que la version actuelle, qui peut avoir changé ou supprimé.
La version en cache agit comme un instantané dans le temps, ce qui permet à l’utilisateur de reconnaître ou de se souvenir plus facilement du contenu qu’il recherche. Ceci est particulièrement utile lorsque l’utilisateur ne se souvient pas de détails précis comme le nom de la page ou où il l’a trouvé, mais le reconnaîtrait s’il le revoyait. En montrant la version que l’utilisateur a vu, le système rend l’expérience de recherche plus alignée sur la façon dont les gens se souviennent des choses.
Applications potentielles de l’invention des brevets
Le système décrit dans le brevet peut être appliqué dans plusieurs contextes du monde réel où les utilisateurs peuvent vouloir récupérer le contenu qu’ils ont déjà vu:
Moteurs de recherche
Le brevet fait référence plusieurs fois à l’utilisation de cette technique dans le contexte d’un moteur de recherche qui récupère les résultats non pas du Web public, mais de l’historique personnel de l’utilisateur, comme les pages Web et les e-mails précédemment visités. Bien que le système soit conçu pour rechercher uniquement le contenu auquel l’utilisateur a accédé auparavant, le brevet note que certaines implémentations peuvent également inclure des documents supplémentaires pertinents pour la requête, même si l’utilisateur ne les a pas consultés auparavant.
Envoyez des e-mails aux clients
Le système traite les e-mails précédemment accessibles dans le cadre de l’historique consultable. Par exemple, il peut retourner un ancien e-mail comme «Grandma’s Turkey Meat Brouilles» basé sur des requêtes vagues en langage naturel.
Assistants vocaux
Le brevet comprend des exemples de «une recherche vocale» où les utilisateurs parlent des requêtes conversationnelles comme «Je recherche une recette de dinde que j’ai lue sur mon téléphone». Le système gère la reconnaissance de la parole et interprète l’intention de récupérer les résultats pertinents de l’histoire personnelle.
Lisez l’intégralité du brevet ici:
Générer des réponses de requête à partir de l’historique d’un utilisateur
Image en vedette par Shutterstock / Jhvephoto