Meta accélère son avancée vers l’intelligence artificielle vocale

"Meta" accélère son avancée vers l'intelligence artificielle vocale

Le géant des réseaux sociaux Meta cherche à renforcer ses capacités en intelligence artificielle vocale cette année, dans le cadre de ses ambitions visant à générer des revenus grâce aux technologies avancées en rapide évolution. Selon des sources bien informées, « Meta » prévoit d’introduire des fonctionnalités vocales améliorées dans son dernier modèle linguistique open-source, « Llama 4 », dont le lancement est prévu dans les semaines à venir. L’entreprise parie sur le fait que les agents d’intelligence artificielle du futur s’appuieront davantage sur les conversations que sur du texte écrit.

La société s’est particulièrement concentrée sur l’amélioration de la fluidité des interactions entre les utilisateurs et son modèle vocal, permettant aux utilisateurs d’interrompre l’IA pendant un échange, au lieu de suivre un modèle rigide basé sur des questions-réponses, selon une source proche du dossier.

Cette initiative intervient alors que Mark Zuckerberg, PDG de « Meta », a mis en place des stratégies audacieuses pour positionner l’entreprise en leader de l’intelligence artificielle, désignant 2025 comme une année clé pour de nombreux produits d’IA de la société. Cette ambition s’inscrit dans un contexte de forte concurrence avec des entreprises comme « OpenAI », « Microsoft » et « Google », toutes cherchant à tirer profit de cette technologie révolutionnaire.

Dans cette optique, « Meta » étudie la possibilité de lancer des abonnements payants pour son assistant intelligent « Meta AI » afin d’exécuter des tâches comme la prise de rendez-vous ou la création de vidéos, selon deux sources bien informées. L’entreprise envisage également d’intégrer des publicités payantes ou des publications sponsorisées dans les résultats de recherche de son assistant IA.

Dans ce contexte, Zuckerberg a dévoilé cette année un projet de développement d’un agent d’intelligence artificielle doté de compétences en programmation et en résolution de problèmes équivalentes à celles d’un ingénieur de niveau intermédiaire. Il estime que ce projet représente un marché potentiel colossal. « Meta » a refusé de commenter ces informations.

Par ailleurs, Chris Cox, directeur des produits chez « Meta », a révélé mercredi certains détails sur les plans de l’entreprise concernant « Llama 4 », expliquant qu’il s’agira d’un modèle « global », permettant une interaction vocale sans conversion préalable en texte avant traitement, puis retranscription en voix. Lors de son intervention à la conférence Morgan Stanley sur la technologie, les médias et les télécommunications, il a déclaré : « Je pense que cette avancée marque une révolution majeure dans les interfaces utilisateur. Les gens pourront parler à Internet et lui demander n’importe quoi. Nous sommes encore en train d’évaluer toute l’étendue de cette innovation. »

« Meta » a également discuté des restrictions éthiques que son nouveau modèle « Llama » devra respecter et envisage d’assouplir certaines d’entre elles, selon deux sources au fait des discussions.

Ces discussions surviennent dans un climat marqué par une vague de nouveaux lancements de la part des concurrents, ainsi que par les avertissements de David Sacks, surnommé le « tsar de l’IA » et investisseur en capital-risque de la Silicon Valley. Ce dernier a déclaré vouloir s’assurer que les modèles d’IA américains ne soient pas politiquement biaisés ou excessivement « éveillés ».

« OpenAI » avait introduit son mode vocal l’année dernière, mettant l’accent sur la personnalisation des assistants intelligents avec des voix distinctes. De son côté, « xAI », la société d’Elon Musk, a lancé fin du mois dernier « Grok 3 » avec des fonctionnalités vocales accessibles à certains utilisateurs. « Grok » a été conçu pour être moins contraignant, proposant un mode « non restreint » capable de fournir des réponses volontairement provocantes et controversées, selon l’entreprise.

L’an dernier, « Meta » avait également publié une version moins « rigide » de son modèle d’intelligence artificielle avec « Llama 3 », après des critiques selon lesquelles « Llama 2 » refusait de répondre à certaines questions jugées inoffensives.

L’interaction vocale avec l’assistant IA constitue un atout clé pour les lunettes intelligentes « Ray-Ban » de « Meta », qui rencontrent un succès croissant auprès des consommateurs. L’entreprise a par ailleurs intensifié ses efforts pour concevoir des casques de réalité augmentée légers, susceptibles de remplacer les smartphones en tant qu’outil informatique principal des utilisateurs.

Thumbnail