Les commandes vocales dans le monde la tech

Mouah ah ah ah ah ! 20 minutes, toujours au top !

2 « J'aime »

J’ai pas tout lu, mais ils pensent réellement qu’interagir uniquement vocalement à grande échelle sera viable ?
Ils ne se disent pas que ça va être un beau bordel dans les rues, dans les maisons, dans les bureaux… avec tout le monde qui va parler en même temps ? :thinking: :man_shrugging:

Ça a l’air acquis dans certaines voitures. Perso ça me rebute.

On travaille bien en openspace :smiley:

Un message a été fusionné à un sujet existant : Trucs complètement idiots, mais je devais poster

Oui mais non, dans la voiture, c’est une personne à la fois qui « communique » vocalement avec une seule AI… dans la rue, c’est X personnes avec X AI en simultané…

Et l’exemple de @Laloutr3 de l’open space donne en effet bien l’idée du bordel que ça peut donner (je déteste ça)

1 « J'aime »

Qui aime ça ? :sweat_smile:

2 « J'aime »

Mais même dans une voiture ça me fait chier. Parce que j’écoute la radio. Parce que je discute avec un passager. Parce qu’appuyer sur un bouton est plus rapide que formuler un besoin.

Personnellement pas convaincu par cet argument dans l’absolu, surtout avec l’UX de certaines interfaces. Mais pour avoir expérimenté les commandes vocales pendant mon immobilisation du bras, je confirme que c’est encore loin d’être optimal.

2 « J'aime »

Je pense qu’on ne peut pas faire de généralité à ce sujet (comme pour d’autres sujets), c’est un peu comme dire : j’ai testé la boîte auto sur une Peugeot il y a 15 ans, j’ai détesté et pour moi maintenant, les boîtes auto, c’est de la merde… :wink:

Les commandes vocales en general, je ne suis pas fan. Mais quand tu conduits, c’est pratique pour deux trucs je trouve : dicter une adresse, et choisir un morceau de musique. Pour tout le reste, je prefère des boutons.

1 « J'aime »

Je réagissais juste sur la formulation de @jeep : pour moi, non, appuyer sur un bouton n’est pas forcément plus rapide que formuler un besoin (surtout si ce besoin simple, comme écouter tel album de tel artiste sur spotify, nécessite de lancer une app, y naviguer, et lancer la lecture). Après, qu’on aime ou pas la possibilité de commander vocalement, c’est autre chose.

Après, oui, pour mettre ton clignotant à gauche ou à droite, un bouton me semble toujours approprié. D’autant que j’imagine que la mémoire musculaire doit jouer à ce niveau-là et qu’on approche du geste semi-conscient, au contraire d’une formulation vocale.

Quand tu as l’habitude d’un système, c’est atroce ce moment qui paraît interminable quand tu dois attendre que la commande vocale termine sa phrase.
C’est comme un clavier complet où toutes les touches sont sous la mains qui est plus rapide qu’un écran où tu dois attendre que le clavier restreint apparaissent, qui est plus rapide qu’une interface graphique ou tu dois déplacer une souris, qui est plus rapide qu’une commande vocale, etc

Ah mais pour ces besoins là, j’en use et j’en abuse. Je pense qu’on lance 50 commandes OK Google chaque jour à la maison. Mais ce sont des cas assez simples et avec des appli bien conçues pour ça. Mais si je dois déplacer un rendez-vous en vérifiant simultanément que ça ne percute pas le planning de ma compagne et que mes collègues n’utilisent pas la salle sur ce créneau, le nombre de commandes vocales et le temps pour les énoncer est bien supérieur au temps que ça va me prendre de le faire « à la main ».
Sachant que dans mon post de base, je ne faisais pas référence aux smartphones mais aux commandes d’une voiture classiquement accessibles via les comodos ou le levier de vitesse.

Ben tu vois, je suis pas convaincu. Surtout avec les progrès récents côté LLM, on commence à toucher à des choses très réactives et flexibles de côté-là. :wink:

J’aime pas sortir des exemples persos pour étayer un propos général, mais j’en discutais avec un ami hier, qui perd progressivement l’usage de sa main (maladie du Viking) et qui s’intéresse de très près à tout ce qui concerne les interfaces vocales, et il m’expliquait que de son côté, il bossait déjà à 80% comme ça, pour tout. Mais il est contraint, donc il y a un moteur à dépasser cette limite des habitudes.

4 « J'aime »

« Je connais quelqu’un handicapé pour qui ça aide bien »
No shit.

Il n’est justement pas handicapé, mais il prévoit de le devenir. Mais merci pour la petite touche gratos d’agressivité qui me rappelle pourquoi on t’avait mis au placard pour un moment. Ce coup-ci, c’est définitif, parce que t’es juste nuisible et épuisant.

9 « J'aime »

Un message a été fusionné à un sujet existant : Trucs complètement idiots, mais je devais poster

le but ca n’est pas de plaquer betement le vocal comme un remplacant d’une interface homme machine et donc de faire les memes étapes que tu ferais, mais de directement obtenir le meme résultat que tu décris sans passer par l’ihm existant.

Donc tu donnes ton ordre et tes contraintes par du vocal, et l’ia va directement agir sans passer par ton ihm limité.

  • « Déplace le rdv de mme michu de lundi à plus tard et trouve le créneau le plus proche »
    « le premier créneau disponible en prenant en compte votre femme et les disponibilités de la salle est vendredi 18, mais si votre femme déplace son creneau de zoomba, cela pourrait être mercredi, dois-je lui demander? Si elle accepte dois-je valider automatiquement? »
    « oui et oui »
    « le rdv est déplacé et mme michu a été prévenue et elle a accepté »

  • « Déplace le rdv de mme michu de lundi à plus tard et trouve le créneau le plus proche en t’arrengeant avec les autres »
    « j’ai vu avec votre femme qui déplace son creneau de zoomba, le rdv de mme michu est déplacé à mercredi, elle a été prévenue et elle a accepté »

Là c’est intéressant, et c’est ce que fait jarvis en exemple.

Je te rejoins si tu dois dire « ia ouvre mon planning, va à mardi, va à mercredi, va à jeudi, va à vendredi, appelle ma femme, etc… », là on est dans juste la transformation d’une IHM de tactile/clavier/souris à du vocal

Pour l’instant, on est quand même loin de cette souplesse d’utilisation. Je n’ai certes qu’un Nest Mini à la maison, mais il ne lie pas les commandes d’une intervention à l’autre, les retours sont très limités, la syntaxe des commandes extrêmement restrictive et, qui plus est, change au gré des mises à jour sans qu’on en soit avertis. À l’usage, en l’état, c’est vraiment pénible et je préfère toujours utiliser les moyens classiques.
Pour que ça change, il faudra vraiment que ça évolue de manière très sensible pour que ce soit massivement adapté, tout le monde n’est pas en mesure de calibrer sa parole en permanence pour se faire comprendre par un interlocuteur limité et borné.
À titre personnel, ce n’est plus à 50 piges que je vais changer facilement de façon de faire, même si ça devenait plus pratique, mais les générations plus jeunes, plus souples et qui ne sont peut-être pas formatés comme moi par des années de pratique du clavier, sauront sûrement s’approprier ces outils s’ils gagnent en performance et en ergonomie.