27/11/2019

BERT l'intelligence artificielle intégrée a google

Un des sujets du moment et l'intégration du nouveau moteur d'intelligence artificielle de Google qui s'appelle Bert.



Edit:google à dit qu'il l'intégrait dans le moteur de recherche au US, par contre l'implementation en France n'est pas prête d'arriver tout de suite, john Mu a dit entre 6mois et 1 an.





Qu'est-ce que BERT ?


Bert a été montré en démonstration du Google IO en mai, il s'agit de moteur neurolinguistique bi-directionnel qui permet de comprendre en entrée les phrases et les questions posées par l'utilisateur, et en sortie de pouvoir les réécrire pour qu'elle soit compréhensible par le moteur de recherche et par l'utilisateur.

https://ai.googleblog.com/2018/11/open-sourcing-bert-state-of-art-pre.html


Quelle est la différence entre BERT et les autres outils NLP comme Open ai GPT ou ELMo ?


Bi-directionnel ! Tien je remet l'image d'intro.




Comment optimiser son site pour BERT ?


Google a lentement annoncé la transformation de son moteur de recherche, en créant les assistants virtuel sous forme d'assistant enceinte.

La prochaine évolution va donc être de s'adapter à ce moteur NLP.

Que veut dire NLP ?

Il s'agit d'un cluster Neurolinguistique, Neurolinguistic Language Processing ou en français traitement automatique du langage ?

Qu'est-ce qu'un traitement automatique du langage ?


Il s'agit d'un NLP ;-)

Il faudra donc centraliser les informations autour de l'utilisateur et de ses intentions plutôt que des mots clés.

Pour pouvoir créer ce NLP de manière efficace Google c'est servi des contenus de wikipédia et de 5 million de mots pour pouvoir interpréter et rephraser les contenus.

Comment adapter BERT en français ?


Il suffirait d'utiliser les mêmes outils que Google. En effet Google a mis en place tensorflow qui est devenu open source, Bert est également open source, et pour l'alimenter Google s'est servi de wikipédia.

Nous pouvons récupérer une base de données des archives de wikipédia en français pour pouvoir sortir à peu près le même résultat.

Voici les ressources pour pouvoir aller télécharger tensorflow, Bert, et la base de données wikipédia pour pouvoir le faire.  Et puis non débrouillez vous ;-)

La bdd wikipedia fr fait, 4,4Go


Comment créer une base de connaissance NLP et analyser les données avec BERT ?


Ok, ce titre ne veut rien dire, mais mon internaute n'y comprend sans doute rien...

Cela nécessitera également du calcul et il faudra prendre des unités de calcul TPU ( c'est le cloud google pour pouvoir calculer des données et en quelques jours)

https://www.love-moi.fr/2019/02/ou-acheter-des-tpu-tensor-processeur.html

Ensuite il faudra appliquer le process de google.

Pourquoi utiliser BERT ?


Pour moi nous devrions être capable de sortir un agent virtuel qui pourra converser de manière naturelle à la plupart des gens en répondant à des informations factuelles que l'on peut trouver sur wikipédia, mais également lui donner des réponses en se connectant à des informations de métier d'une entreprise.

Pour google ce sera aussi pour proposer des reponses pertinentes multilangues.

B.E.R en français

https://youtu.be/n_ToxwFQA50

B.E.R en anglais

https://youtu.be/NgtQiUN6vjQ

Ces vidéos n'ont aucun rapport mais vous avez une ambiance musicale pour la suite.

Comment optimiser ses contenus pour la recherche vocale sur les assistants vocaux ?


A ce qu'il paraît, d'après une étude SEO, on ne peut pas... Y'a rien a faire... 

Comme les recettes de Marie, bien sûr que oui on peut anticiper et apporter le petit plus.

Moi je dirais plutôt visons déjà la position 0... Je dois avoir des gamins qui sont pionnier dans la recherche vocale... Mon plus petit à 5 ans et il ne sait pas lire.

Quand il pose une question a "ok google", soit il a une réponse vocale, soit google lui renvoie des résultats. 

Exemple flagrant d'un test sur La Lune que j'avais fait au lancement  de Google home  et qui marche toujours (voyage sncf est devenue ouisncf) 

Dites ok google je voudrais parler a voyages sncf point com


Ok l'article date de 2017, j'ai refait le test aujourd'hui mais avec alexa.

Alexa allume la lumière.






Une autre opti, c'est que google ne se base plus sur les mots clés comme avant, mais sur les entités et surtout sur la manière dont les internautes posent des questions.

Si vous n'avez pas vu l'explosion des blocs frequent ask answer, je vous conseille d'aller voir un ophtalmo.

C'est la la manière dont les internautes posent leur questions et pour lequel google donne une reponse.

Bert va analyser la phrase et son contexte et va renvoyer vers une reponse normalisée. Si on revient a mon chatbot d'il y a 10 ans, c'est ce qu'on appelait une réduction symbolique. On prend plusieurs tournure et on la faut matcher avec une normalisée. Google rephrase deja votre requête quand il pense qu'il n'y a pzs la bonne orthographe.


Autre possibilité complémentaire si vous êtes sur la position 0 et que vous êtes le meilleur candidat. C'est de mettre une balisage schéma "speakable" (merci raphseo pour le rappel)

 Peut être que ça ne sert a rien, mais ça ne mange pas de pain d'anticiper (sauf d'avoir la flemme)

#Todo:  migrer le site sur wordpress, google n'accepte pas le javascript, en plus le site est moche ;-)

Comment créer un chatbot avec l'aide de BERT ?


Pour créer une chatbot, il y a quand même des spécificités et un marketing d'engagement qui va être complètement différent de ce que l'on a l'habitude de produire en tant que marketing.

Je m'était penché il y a plus de 11 ans sur la programmation de bot avec un moteur du loebner prize qui gagnait systématiquement le concours de test de turing : alicebot et son langage AIML. Aujourd'hui encore le gagnant du lobner prize s'appelle mitsuku et fonctionne sur cette techno. Vos siri, ok google, alexa, sont ses enfants...

Mais là on va sortir du seo pur ;-)

voici une ressources pour pouvoir s'adapter à ce changement de la conception du bot.

https://pair.withgoogle.com/

Aucun commentaire:

Enregistrer un commentaire

Merci de ne pas afficher juste un merci et un lien spammy, argumentez un minimum svp, sinon j'arrête tout, ce serait dommage.
Je modère a priori, ne vous inquiétez pas si votre message n'apparaît pas tout de suite, je fais pleins de choses en même temps.