sentenza
28/05/2014, 21h58
Microsoft a présenté hier soir lors d’une conférence une importante évolution prévue pour Skype plus tard dans l’année. Il s’agit d’un module de traduction en temps réel capable d’écouter la voix d’un correspondant d’un côté, et d’en donner oralement la version dans une autre langue dans la foulée.
http://static.pcinpact.com/images/bd/news/medium-147172.jpeg (http://static.pcinpact.com/images/bd/news/147172.jpeg)
Traduire oralement et en temps réel une autre langue
Lorsque Microsoft a racheté Skype pour 8,5 milliards de dollars (http://www.nextinpact.com/news/63477-microsoft-rachat-skype-85-milliards-dollars-integration.htm), de nombreux observateurs n’ont pas manqué de souligner qu’il s’agissait d’une somme colossale pour une « simple » solution de messagerie. Évidemment, le sens de « colossal » est devenu plus relatif depuis le rachat de WhatsApp par Facebook, pour un total de 19 milliards de dollars. Mais Microsoft avait rapidement indiqué de son côté que Skype serait une brique importante de sa stratégie, et toutes les décisions prises depuis vont dans ce sens, la messagerie ayant totalement remplacé Live Messenger par exemple.
Dans une démonstration réalisée hier soir (http://blogs.technet.com/b/microsoft_blog/archive/2014/05/27/microsoft-demos-breakthrough-in-real-time-translated-conversations.aspx#.U4Vd5DM4Cw8.twitter), Microsoft a dévoilé quel genre d’évolution était prévu pour sa solution de messagerie. En développement au sein de Microsoft Research depuis plusieurs années, une solution de traduction en temps réel sera ainsi ajoutée à la version Windows 8 de Skype plus tard dans l’année. Le principe de fonctionnement en est simple : deux personnes utilisant des langues différentes pourront se parler, Skype se chargeant de traduire oralement les propos de chacun.
Comme on peut le voir dans la vidéo de démonstration, un américain et un allemand font une conférence Skype. Dès que l’utilisateur allemand parle, l’autre reçoit sur son écran une version écrite de ce qui vient d’être prononcé. Juste après, la synthèse vocale prend le relai pour prononcer les mots.
Même perfectible, la démonstration reste impressionnante car naturelle
La solution semble efficace, mais la technologie peut encore être améliorée, comme on peut le voir dans cette autre vidéo ci-dessous. Il s’agit de la démonstration réalisée hier soir lors de la conférence Re/Code, à la suite d’un entretien sur le sujet avec Satya Nadella, PDG de Microsoft. Cette démonstration a été réalisée par Gurdeep Pall, qui dirige les équipes de Skype et de Lync. On peut y voir là encore un entretien entre des utilisateurs américain et allemand. Mais on peut remarquer que ces derniers prennent bien soin d’articuler très soigneusement. Les majuscules ne sont pas toujours présentes et la ponctuation devrait être renforcée.
http://www.youtube.com/watch?feature=player_embedded&v=eu9kMIeS0wQ
Dans tous les cas, la démonstration réalisée par Microsoft reste impressionnante. La reconnaissance fonctionne bien et c’est la quasi-simultanéité des traductions qui renforce l’impression de « naturel » de cette solution. D’autant que l’utilisateur obtient un flux audio dans la langue de son interlocuteur, la phrase écrite qu’il vient de prononcer et sa version dans l’autre langue. Il s’agit d’ailleurs pour Satya Nadella de l’illustration parfaite de l’évolution qu’il constate pour l’informatique en général, qui se dirige vers une ère « plus personnelle, plus humaine ».
Mais évidemment, la question qui intéressante maintenant est : quand ? Selon le PDG de Microsoft, une version bêta de ce traducteur en temps réel sera disponible plus tard dans l’année sur Windows 8, sans aucune date plus précise pour l’instant. Cette phase de test sera suivie d’une diffusion plus générale sur d’autres plateformes. Interrogé sur la possibilité d’appeler un interlocuteur en Égypte et d’entretenir facilement une conversation traduite, Nadella a répondu que ce serait le cas « au cours des deux prochaines années ».
http://static.pcinpact.com/images/bd/news/medium-147172.jpeg (http://static.pcinpact.com/images/bd/news/147172.jpeg)
Traduire oralement et en temps réel une autre langue
Lorsque Microsoft a racheté Skype pour 8,5 milliards de dollars (http://www.nextinpact.com/news/63477-microsoft-rachat-skype-85-milliards-dollars-integration.htm), de nombreux observateurs n’ont pas manqué de souligner qu’il s’agissait d’une somme colossale pour une « simple » solution de messagerie. Évidemment, le sens de « colossal » est devenu plus relatif depuis le rachat de WhatsApp par Facebook, pour un total de 19 milliards de dollars. Mais Microsoft avait rapidement indiqué de son côté que Skype serait une brique importante de sa stratégie, et toutes les décisions prises depuis vont dans ce sens, la messagerie ayant totalement remplacé Live Messenger par exemple.
Dans une démonstration réalisée hier soir (http://blogs.technet.com/b/microsoft_blog/archive/2014/05/27/microsoft-demos-breakthrough-in-real-time-translated-conversations.aspx#.U4Vd5DM4Cw8.twitter), Microsoft a dévoilé quel genre d’évolution était prévu pour sa solution de messagerie. En développement au sein de Microsoft Research depuis plusieurs années, une solution de traduction en temps réel sera ainsi ajoutée à la version Windows 8 de Skype plus tard dans l’année. Le principe de fonctionnement en est simple : deux personnes utilisant des langues différentes pourront se parler, Skype se chargeant de traduire oralement les propos de chacun.
Comme on peut le voir dans la vidéo de démonstration, un américain et un allemand font une conférence Skype. Dès que l’utilisateur allemand parle, l’autre reçoit sur son écran une version écrite de ce qui vient d’être prononcé. Juste après, la synthèse vocale prend le relai pour prononcer les mots.
Même perfectible, la démonstration reste impressionnante car naturelle
La solution semble efficace, mais la technologie peut encore être améliorée, comme on peut le voir dans cette autre vidéo ci-dessous. Il s’agit de la démonstration réalisée hier soir lors de la conférence Re/Code, à la suite d’un entretien sur le sujet avec Satya Nadella, PDG de Microsoft. Cette démonstration a été réalisée par Gurdeep Pall, qui dirige les équipes de Skype et de Lync. On peut y voir là encore un entretien entre des utilisateurs américain et allemand. Mais on peut remarquer que ces derniers prennent bien soin d’articuler très soigneusement. Les majuscules ne sont pas toujours présentes et la ponctuation devrait être renforcée.
http://www.youtube.com/watch?feature=player_embedded&v=eu9kMIeS0wQ
Dans tous les cas, la démonstration réalisée par Microsoft reste impressionnante. La reconnaissance fonctionne bien et c’est la quasi-simultanéité des traductions qui renforce l’impression de « naturel » de cette solution. D’autant que l’utilisateur obtient un flux audio dans la langue de son interlocuteur, la phrase écrite qu’il vient de prononcer et sa version dans l’autre langue. Il s’agit d’ailleurs pour Satya Nadella de l’illustration parfaite de l’évolution qu’il constate pour l’informatique en général, qui se dirige vers une ère « plus personnelle, plus humaine ».
Mais évidemment, la question qui intéressante maintenant est : quand ? Selon le PDG de Microsoft, une version bêta de ce traducteur en temps réel sera disponible plus tard dans l’année sur Windows 8, sans aucune date plus précise pour l’instant. Cette phase de test sera suivie d’une diffusion plus générale sur d’autres plateformes. Interrogé sur la possibilité d’appeler un interlocuteur en Égypte et d’entretenir facilement une conversation traduite, Nadella a répondu que ce serait le cas « au cours des deux prochaines années ».