
Worklog Navimedia
-
- Messages : 2106
- Inscription : mer. sept. 20, 2006 8:36 pm
- Contact :
Re: Worklog Navimedia
et enfin la dernière pour aujourd'hui
http://www.dailymotion.com/video/x2ktg6_gizmogo_auto

-
- Messages : 2106
- Inscription : mer. sept. 20, 2006 8:36 pm
- Contact :
Re: Worklog Navimedia
Reconnaissance vocale pour bientôt
http://www.dailymotion.com/video/x2lnww_re...francais-s_tech
Après avoir cherché une solution depuis plusieurs mois et que rien d'exploitable n'existe, j'ai converti un programme de reconnaissance vocale en Français. ça fonctionne plutôt pas mal et viendra compléter sous peu ce qui est déjà embarqué
Cette reconnaissance vocale ne nécessite pas d'entrainement préalable par locuteur, en d'autres termes, la machine analyse non pas la forme des enveloppes du son mais son contenu.
Ainsi à l'instar de pas mal de reconnaissances vocales du commerce, celle que j'utilise est dotée "d'intelligence" et ne se borne pas à bêtement comparer des courbes.

http://www.dailymotion.com/video/x2lnww_re...francais-s_tech
Après avoir cherché une solution depuis plusieurs mois et que rien d'exploitable n'existe, j'ai converti un programme de reconnaissance vocale en Français. ça fonctionne plutôt pas mal et viendra compléter sous peu ce qui est déjà embarqué

Cette reconnaissance vocale ne nécessite pas d'entrainement préalable par locuteur, en d'autres termes, la machine analyse non pas la forme des enveloppes du son mais son contenu.
Ainsi à l'instar de pas mal de reconnaissances vocales du commerce, celle que j'utilise est dotée "d'intelligence" et ne se borne pas à bêtement comparer des courbes.
-
- Messages : 2106
- Inscription : mer. sept. 20, 2006 8:36 pm
- Contact :
Re: Worklog Navimedia
Pour ceux qui auraient besoin d'une reconnaissance vocale en Français à bord, bonne nouvelle, le package est prêt, perso je vais l'ajouter lors de la prochaine grosse modif 
Avant de télécharger assurez vous que les pré-requis sont conformes à votre installation.
Il vous faut :
Perl (which perl pour vous aider à déterminer si vous l'avez...en principe oui)
Espeak compilé depuis les sources, certaines distributions proposent des packages fonctionnels mais hélas trop anciens.
Sphinx 2 sans aucune condition supplémentaire, n'importe lequel devrait faire l'affaire, ne vous souciez pas des dictionnaires le tout étant d'avoir sphinx en version minimale et en anglais.
Téléchargez perlbox voice version Française dans le sous-répertoire /tmp et décompressez l'archive.
En tant que root :
Entrez dans le sous-répertoire perlbox-voice-fr-1.0 nouvellement crée par l'archive et lancez la commande ./install.pl
Cliquez sur OK, l'installation se fait et voilà c'est prêt à être utilisé.
Quittez le compte root, montez un peu le son, vérifiez que votre micro est bien branché, gardez le mixer sous les yeux le temps de trouver un réglage du micro idéal, lancez perlbox-voice depuis une console.
http://www.r-kraft.com/perlbox-voice-fr-1.0.tar.bz2
C'est également dispo sur tuxfamily.
http://perlboxfr.tuxfamily.org/

Avant de télécharger assurez vous que les pré-requis sont conformes à votre installation.
Il vous faut :
Perl (which perl pour vous aider à déterminer si vous l'avez...en principe oui)
Espeak compilé depuis les sources, certaines distributions proposent des packages fonctionnels mais hélas trop anciens.
Sphinx 2 sans aucune condition supplémentaire, n'importe lequel devrait faire l'affaire, ne vous souciez pas des dictionnaires le tout étant d'avoir sphinx en version minimale et en anglais.
Téléchargez perlbox voice version Française dans le sous-répertoire /tmp et décompressez l'archive.
En tant que root :
Entrez dans le sous-répertoire perlbox-voice-fr-1.0 nouvellement crée par l'archive et lancez la commande ./install.pl
Cliquez sur OK, l'installation se fait et voilà c'est prêt à être utilisé.
Quittez le compte root, montez un peu le son, vérifiez que votre micro est bien branché, gardez le mixer sous les yeux le temps de trouver un réglage du micro idéal, lancez perlbox-voice depuis une console.
http://www.r-kraft.com/perlbox-voice-fr-1.0.tar.bz2
C'est également dispo sur tuxfamily.
http://perlboxfr.tuxfamily.org/
-
- Messages : 2106
- Inscription : mer. sept. 20, 2006 8:36 pm
- Contact :
Re: Worklog Navimedia
Une vidéo qui permet de voir ce que ça donne avec la reprise des commandes au volant
et en prime un ballade dans les patelins paumés du loir et cher http://www.dailymotion.com/video/x2n7b0_video-player_music

-
- Messages : 2106
- Inscription : mer. sept. 20, 2006 8:36 pm
- Contact :
Re: Worklog Navimedia
la dernière pour aujourd'hui, gps 3D + musique + pilotage depuis les boutons du volant via i-bus.
http://www.dailymotion.com/video/x2nbuh_gp...imultanes_music
http://www.dailymotion.com/video/x2nbuh_gp...imultanes_music
-
- Messages : 2106
- Inscription : mer. sept. 20, 2006 8:36 pm
- Contact :
Re: Worklog Navimedia
Un autre axe intéressant sur lequel je travaille, en plus de la reconnaissance vocale qui est fonctionnelle à présent, la reconnaissance visuelle, au départ j'avais pensé à faire une reconnaissance vocale appuyée par une lecture sur les lèvres mais en cherchant à faire plus simple, on arrive à des choses intéressantes. Le suivi du visage par exemple ou le suivi du mouvement. C'est diabloique d'efficacité
Alors à quoi ça peut-il donc servir ?
Plutôt que d'avoir un écran tactile que l'on ne manque pas de salir (si si, même si on a les mains propres, après quelques heures de conduite, les mains qu'on le veuille ou non secrètent de la transpiration, capturent des petites poussières etc, bref l'écran est inexorablement sali. La reprise des commandes au volant, pas mal mais insuffisant pour entrer une adresse par exemple.
La reconnaissance vocale, sympa a utiliser mais pour peu que l'on écoute une musique un peu fort et c'en est fini alors pour pallier à ce problème en particulier il y a encore la reconnaissance de gestes (qui peuvent être très modérés)
Que l'ordinateur suive mes yeux, ma main ou interprête un mot prononcé (lecture labiale) cette solution semble un terrain de jeu intéressant à explorer.
Vous trouverez plusieurs vidéos de mes derniers essais dont l'identification d'un visage et ce quelque soit la source, le suivi d'un point précis désigné etc...
http://www.dailymotion.com/videos/relevanc...rch/rkraft_fr/1

Alors à quoi ça peut-il donc servir ?
Plutôt que d'avoir un écran tactile que l'on ne manque pas de salir (si si, même si on a les mains propres, après quelques heures de conduite, les mains qu'on le veuille ou non secrètent de la transpiration, capturent des petites poussières etc, bref l'écran est inexorablement sali. La reprise des commandes au volant, pas mal mais insuffisant pour entrer une adresse par exemple.
La reconnaissance vocale, sympa a utiliser mais pour peu que l'on écoute une musique un peu fort et c'en est fini alors pour pallier à ce problème en particulier il y a encore la reconnaissance de gestes (qui peuvent être très modérés)
Que l'ordinateur suive mes yeux, ma main ou interprête un mot prononcé (lecture labiale) cette solution semble un terrain de jeu intéressant à explorer.
Vous trouverez plusieurs vidéos de mes derniers essais dont l'identification d'un visage et ce quelque soit la source, le suivi d'un point précis désigné etc...
http://www.dailymotion.com/videos/relevanc...rch/rkraft_fr/1
-
- Messages : 82
- Inscription : lun. nov. 06, 2006 8:42 am
Re: Worklog Navimedia
Tout simplement impressionnant, félicitation pour la qualité du travail effectué.
Euh, tu me fait la meme instal dans la mienne???



Euh, tu me fait la meme instal dans la mienne???

-
- Messages : 2106
- Inscription : mer. sept. 20, 2006 8:36 pm
- Contact :
-
- Messages : 2106
- Inscription : mer. sept. 20, 2006 8:36 pm
- Contact :
Re: Worklog Navimedia
Le dernier bout de code en date, un suivi des yeux.
pour comprendre cette vidéo il faut que vous sachiez que d'une part elle n'est pas faite pour être belle à regarder, ce que vosu voyez est ce que l'ordinateur "voit" dans la pratique cette vidéo n'apparaît pas, elle est donc là juste pour illuster la détection de direction dans laquelle le regard se porte.
Ensuite les cercles matérialisent les ROI (region of interest) que le code détecte, une fois cette ROI identifiée, il cherche à déterminer le sens. Donc le segment que vous voyez depuis le centre du cercle pointe dans la direction du regard.
Bientôt mieux que les commandes i-bus ?
Bon il y a encore un travail énorme, assurer un tracking de la zone voulue, restriction de cette même zone afin d'éviter des calculs parasites mais ça devient de plus en plus intéressant
une voiture qui obéit au doigt
http://www.dailymotion.com/video/x2pj6l_de...mouvements_tech
http://www.dailymotion.com/video/x2pld5_ge...ce-video_webcam
et à l'oeil
http://www.dailymotion.com/rkraft_fr/video...ch-my-eyes_auto
ne pourra pas trouver meilleure illustration
pour comprendre cette vidéo il faut que vous sachiez que d'une part elle n'est pas faite pour être belle à regarder, ce que vosu voyez est ce que l'ordinateur "voit" dans la pratique cette vidéo n'apparaît pas, elle est donc là juste pour illuster la détection de direction dans laquelle le regard se porte.
Ensuite les cercles matérialisent les ROI (region of interest) que le code détecte, une fois cette ROI identifiée, il cherche à déterminer le sens. Donc le segment que vous voyez depuis le centre du cercle pointe dans la direction du regard.
Bientôt mieux que les commandes i-bus ?

Bon il y a encore un travail énorme, assurer un tracking de la zone voulue, restriction de cette même zone afin d'éviter des calculs parasites mais ça devient de plus en plus intéressant

une voiture qui obéit au doigt
http://www.dailymotion.com/video/x2pj6l_de...mouvements_tech
http://www.dailymotion.com/video/x2pld5_ge...ce-video_webcam
et à l'oeil
http://www.dailymotion.com/rkraft_fr/video...ch-my-eyes_auto
ne pourra pas trouver meilleure illustration

- JayDee
- Messages : 182
- Inscription : ven. août 03, 2007 11:27 pm
Re: Worklog Navimedia
c'est un projet de fou ca j'ai fait un carmedia avec gps tactile touchpad et tt mais là on est bien au dessus je te félicite

Qui est en ligne ?
Utilisateurs parcourant ce forum : Aucun utilisateur inscrit et 5 invités