bonjour !
j'ai terminé un logiciel de reconnaissance vocale pour ubuntu / debian. ça permet de patcher avec des commandes vocales (anglais, japonais pour l'instant *).
voici 3 vidéos (installation, avec Blender, avec PureData) :
http://www.workinprogress.ca/kiku/video/
téléchargement ici :
http://www.workinprogress.ca/kiku/download/
* une version française serait possible, mais il faudrait que beaucoup de monde participent au projet voxforge. super simple, vous dites à haute voix les phrases qui vous montrent.
http://www.voxforge.org/fr/read
à+
Hors ligne
Chouette ! En terme d'accessibilité et d'ergonomie il est évident que cela va servir à beaucoup de gens, vraiment utile ce genre de logiciel, bravo ! (je regarde pour voxforge)
Hors ligne
Oui, chouette ! mumuse garanti pendant des heures . Juste une question avant que j'essaie avec les sources : pulse-audio est il mandataire ? c'est le genre de truc que beaucoup d'utilisateurs orientés création video/musique désinstallent vu les soucis engendrés .
Hors ligne
Salut,
Effectivement les utilisateurs audio - vidéo n'aime pas PulseAudio. Il serait possible de compiler une version de kiku avec ALSA ou même PortAudio. JACK est possible avec un plugin à Julius (le moteur de reconnaissance vocale). En passant, compiler kiku est un peu complexe (version svn de wxwidgets 2.9, xdotool patché, etc). Il y a quand même une brève explication dans le main.cpp :
https://github.com/patricksebastien/kik … u/main.cpp
Cheers
Hors ligne
La vidéo est impressionnante.
C'est effectivement un beau projet qui dépasse un peu Pd, pour s'orienter vers l'accessibilité.
Pour l'instant, tout ceci me paraît encore un peu compliqué à mettre en oeuvre. Les dépendances sont fortes.
Mais les avancées aussi le sont.
Hors ligne
Salut à tous!
salut psc,
bravo pour ton projet (c'est qui t'es écrit tout à l'heure)
je n'ai pas eu de souci de dépendances chez moi (enfin minimes, il a fallu que j'installe un paquet supplémentaire)
cependant au lancement du soft, j'ai cette erreur:
ASSERT INFO:
/home/psc/11h11/code/kiku/kiku/jsonval.cpp(907): assert "IsDouble()" failed in AsDouble().
BACKTRACE:
[1] wxOnAssert(char const*, int, char const*, char const*, char const*)
[2] wxJSONValue::AsDouble() cons)
[3] MainFrame::readpreference()
Hors ligne
jerome a écrit:
Pour l'instant, tout ceci me paraît encore un peu compliqué à mettre en oeuvre. Les dépendances sont fortes.
Mais les avancées aussi le sont.
salut,
le but de kiku est de rendre la reconnaissance vocale "facile" à installer et utiliser. il y a une solution beaucoup plus complète appellé Simon Listens.
Normalement tu as juste besoin de télécharger le .deb, l'installer, choisir un language (english ou japanese), aller dans import - application, choisir pd-extended et installer et ensuite ouvrir pd et dire des choses comme: object, message etc...
Au niveau de la dépendances, ici j'ai juste libnotify à installer sur 10.04 et 10.10. Il y a un gros bug avec 11.04 dans compiz qui empêche de créer un icône dans le taskbar... ça va être réglé quand les devs vont s'occuper de ce bug.
Si tu parles des dépendances pour la compilation, oui effectivement il y a : julius, xdotool, libpd (pour limiter, filtrer, etc).
à+
Hors ligne
space47 a écrit:
ASSERT INFO:
/home/psc/11h11/code/kiku/kiku/jsonval.cpp(907): assert "IsDouble()" failed in AsDouble().
Salut Space47,
Oui, c'est mon premier logiciel que je release (j'ai appris le C++ en même temps que de coder ce logiciel). Peut-être devrais-je mentionner que c'est alpha. Cependant, à date tu es le premier qui rapporte un problème.
Pourrais-tu me donner plus d'informations:
- quel package as-tu téléchargé : 32bit ou 64bit
- quel distribution : ubuntu 11.04, 10.10 ou debian ou autre
Merci !
à+
Hors ligne
citation :
Si tu parles des dépendances pour la compilation, oui effectivement il y a : julius, xdotool, libpd (pour limiter, filtrer, etc).
Oui je parlais de celles pour la compilation. Mais pourrait-on faire autrement ?
Dans tous mes projets de développement, je me pose la question du multiplateforme. Est-ce que c'est envisageable ici ?
Dernière modification par jerome (2011-06-14 11:27:58)
Hors ligne
jerome a écrit:
Dans tous mes projets de développement, je me pose la question du multiplateforme. Est-ce que c'est envisageable ici ?
Pour OS X pas de problème puisque xdotool le supporte, cependant pour Windows il faudrait trouver une solution alternative pour controller la sourie et le clavier. Pour le reste : julius, wxwidgets, libpd sont tous cross-platform, donc il serait possible de faire une version Windows et OS X. Cependant, je n'utilise pas ces OS, donc il faudrait qu'une personne motivée fasse le travail.
À+
Hors ligne
citation :
Cependant, à date tu es le premier qui rapporte un problème.
Whaaeeuuu l'auuuutreeeuuu... c'est moi le premier d'abord !!
Je me suis même donné la peine de le poster sur le forum que tu as dédié à cela...
De toutes façon, on va gagner...
Merci encore pour ce projet.
Hors ligne
Salut Olivier,
Merci beaucoup d'avoir rapporté ce problème dans le forum ! Je suis en train de regarder comment intégrer ALSA et JACK pour que ça soit + facile d'utiliser avec PureData. Je pensais aussi que ça serait pratique d'avoir Open Sound Control intégré à kiku. En tout cas, il y a beaucoup à faire et effectivement on peut considérer kiku en version beta.
À+
Hors ligne
sur le site de jackd il y a un exemple pour écrire (en C) une appli jack . tu a sûrement vu, je dis çà juste pour encourager et parce que j'ai été ennuyé avec des soucis de latence en utilisant espeak et festival (qui ne connaissent pas jackd) avec puredata : http://codelab.fr/2260
quand à OSC >>> n'en voilà une bonne idée, une très bonne idée même vu que les messages sont manipulables .
Dernière modification par sakramh (2011-06-14 20:22:33)
Hors ligne
J'ai regardé un peu rapidement les possibilités. Ce qui serait simple à faire est d'implémenter ALSA sans libpd (pas de filtre et limiteur), un peu plus complexe mais "doable" serait ALSA avec libpd et finalement ça serait mieux de carrément utiliser un "common API" tel que RTAudio ou PortAudio...
Pour ce qui est du OSC, je crois que je pourrais relativement facilement intégrer liblo à kiku.
À suivre, car présentement je suis surtout occupé à produire une version de kiku spécifiquement pour Vinux (Linux for the visually impaired). Donc, ça va prendre quand même du temps.
Hors ligne
salut psc!
voici ma distrib: Ubuntu 11.04 - the Natty Narwhal - released in April 2011
j'ai télécharger la version 32-bit
le message que je t'ai donné s'affiche, par la suite le logiciel démarre, mais ne fonctionne pas: pas de son.
Hors ligne