NLP, le Natural Language Processing chez Altares

16 janvier 2020

Partager l'article :

Le NLP est un domaine à la croisée de la linguistique, de l’informatique et de l’intelligence artificielle.
Le NLP est un domaine à la croisée de la linguistique, de l’informatique et de l’intelligence artificielle.

Sommaire

En septembre 2018, Altares faisait l’acquisition d’Invoxis, une start-up spécialisée dans l’enrichissement et la visualisation d’information au service de la connaissance clients. L’ancienne équipe NLP d’Invoxis œuvre désormais au sein d’Altares. Stéphanie Brizard, Manager de l’équipe NLP nous en dit plus sur les applications du NLP chez Altares.

Stéphanie, pouvez-vous nous expliquer ce qu’est le NLP ?

NLP signifie Natural Language Processing, Traitement Automatique du Langage Naturel ou Traitement Automatique des Langues. C’est un domaine à la croisée de la linguistique, de l’informatique et de l’intelligence artificielle. Il vise la mise en œuvre d’outils informatiques qui permettent de traiter et d’analyser des données exprimées en langage naturel. A l’origine, le TAL était l’apanage de laboratoires de recherche. Il en est progressivement sorti pour trouver des applications industrielles. Parmi elles, on peut citer l’extraction d’information, l’analyse syntaxique (structure de la langue) ou sémantique (sens), la génération automatique de textes ou encore la synthèse vocale. Le NLP bénéficie aujourd’hui des algorithmes de Machine Learning et des réseaux de neurones.

Quel a été votre parcours professionnel ?

A l’origine, je suis diplômée traductrice-interprète quadrilingue, mais je me suis réorientée pour devenir linguiste NLP. J’ai gardé comme fil conducteur ma passion des langues et de leur mécanique interne. J’ai d’abord exercé en tant qu’ingénieure linguiste et ai ensuite pris la responsabilité d’une équipe de linguistes en 2013 à mon entrée chez Invoxis.

Quelle est la constitution de l’équipe NLP ?

Notre équipe, pluridisciplinaire, est composée de linguistes et de développeurs NLP. Les linguistes se chargent de tout ce qui concerne la modélisation linguistique, tandis que les développeurs s’occupent de la partie logicielle et de l’exploitation des travaux des linguistes. Pour faire une analogie avec le monde automobile, les développeurs travaillent sur le moteur et les linguistes sur le carburant.

Quelle approche NLP utilisez-vous ?

Nous utilisons une approche symbolique ou linguistique, basée sur la connaissance de la structure d’une langue et de son vocabulaire. Nous construisons à la main des règles linguistiques suivant ce que nous souhaitons détecter dans un texte. Au contraire des modèles statistiques, nous savons exactement ce que nous voulons trouver et c’est ce que nous décrivons dans nos règles, permettant ainsi une grande précision et une pertinence élevée des résultats. Nous évitons également l’effet boîte noire reproché aux modèles Machine Learning. Si nos outils font des erreurs, nous pouvons les corriger.

Quelles sont les spécialisations de l’équipe NLP ?

Notre équipe est tournée vers l’extraction d’information. Nous analysons la donnée numérique issue d’internet pour en retirer de l’information qui fait sens. Nous nous sommes spécialisés dans l’analyse syntaxique fine de la phrase avec la détection d’entités nommées, de groupes syntaxiques ou d’événements tels que les liens capitalistiques ou encore les risques de type Compliance (corruption, blanchiment d’argent, détournement de fonds, financement du terrorisme…). Pour résumer, nous détectons ce qui permet de répondre aux questions du type “Qui ?”, “Quoi ?”, “Où ?”, “Quand ?” grâce notamment aux entités nommées comme les noms de personnes, d’organisations, de lieux, etc. ou encore les montants monétaires et les dates.

Quelles sont les applications du NLP chez Altares ?

Les applications du NLP pour les problématiques d’Altares sont diverses : veille/extraction d’informations sur des entités ou des événements, aide à la collecte d’informations et à la prise de décision. Nous intervenons aussi dans l’amélioration de la qualité de la data en la nettoyant ou en venant l’enrichir avec des informations extraites en ligne. Le NLP vient en complément de processus humains et décisionnels déjà existants, sans s’y substituer.

Quelles sont les synergies avec la Data Science ?

Nous avons en commun un fonctionnement de type labo de recherche. L’expérimentation et la R&D sont un aspect non négligeable de notre travail si nous voulons rester au cœur de l’innovation. Par ailleurs, les deux disciplines se renforcent l’une l’autre, dans des interactions du quotidien mais aussi sur des projets bien identifiés, comme la construction d’indicateurs ou encore l’analyse de populations clients.

Altares Dun & Bradstreet

Altares Dun & Bradstreet

Expert de l’information sur les entreprises, Altares collecte, structure, analyse et enrichit les données BtoB afin de les rendre « intelligentes » et faciliter la prise de décision pour les directions générales et opérationnelles des entreprises. Le groupe propose son expertise sur toute la chaine de valeur de la data. Partenaire exclusif en France, au Benelux et au Maghreb de Dun & Bradstreet, 1er réseau international d’informations BtoB, Altares se positionne comme le partenaire de référence des grands comptes, ETI, PME et organisations publiques, en leur offrant un accès privilégié à ses bases de données sur 500 millions d’entreprises dans 220 pays.

Bienvenu sur notre espace d’aide en ligne, veuillez choisir une des options ci-dessous.

Prenez rendez-vous avec un expert