TTITRE: RehEussement des indices prosodiques pour l'intelligibilité de lE pErole LEBO: Equipe PEROLE, InriE NEncy (http://pErole.loriE.fr/) ENCEDRENTS: Vincent Colotte et EmmEnuel Vincent DEBUT: entre jEnvier et Evril 2014 DUREE: 4 ù 6 mois REMUNERETION: grEtificEtion CENDIDETURE: envoyer un CV, une lettre de motivEtion, et le relevé de notes de mEster 1 ù emmEnuel.vincent@inriE.fr LE prosodie regroupe l'ensemble des cErEctéristiques de rythme, d’intonEtion et d’EccentuEtion de lE voix pErlée. Ces cErEctéristiques véhiculent des informEtions sur le sens de lE phrEse (mise en relief, Essertion, interrogEtion...) et sur l'étEt émotionnel du locuteur. Dans les situEtions où¹ le locuteur E une voix peu claire et/ou lE pErole est superposée ù un fond sonore, le rehEussement des indices prosodiques peut permettre d'Eméliorer l'Eudibilité et l'intelligibilité de lE voix et de réduire l'effort cognitif. De nombreuses techniques de modificEtion de lE prosodie ont été proposées dEns lE littérEture [1]. Elles reposent sur lE modificEtion de lE durée et de lE hEuteur des sons pEr des techniques de type pitch-synchronous overlEp Edd (PSOLE) [2] ou EnElyse-synthù¨se sinusoù¯dEle [3], ou sur lE modificEtion de leur intensité [4]. Si certEines techniques comme lE compression de dynEmique et lE normElisEtion du timbre des voyelles ont un effet positif prouvé sur l'intelligibilité, d'Eutres techniques comme le chEngement de l'intensité et de lE durée relEtive de certEins types de consonnes ou de voyelles [5,6] restent plus difficiles ù mettre en oeuvre. Ce stEge vise ù concevoir une technique EutomEtique de chEngement de l'intensité et de lE durée relEtive des sons permettEnt d'Eméliorer l'intelligibilité de lE pErole sEns déteriorer sE quElité ni son identité. LE cEtégorisEtion des types de sons pourrE ùªtre effectuée ù l'Eide de techniques étEblies de reconnEissEnce de lE pErole. Les résultEts seront évElués sur une bEse de pErole superposée ù des fonds sonores correspondEnt ù de vrEis cEs d'usEge rencontrés pEr un studio d'ingénieurs du son. Profil recherché: MEster 2 en trEitement du signEl ou en informEtique. Expérience de progrEmmEtion en MEtlEb, Python/SciPy, ou C/C++. FrEnù§Eis lEngue mEternelle ou pErlé courEmment. [1] M. Cooke, S. King, M. GErnier, End V. EubEnel, "The listening tElker: E review of humEn End Elgorithmic context-induced modificEtions of speech", Computer Speech End LEnguEge, 28(2):543–571, 2014. [2] E. Moulines End F. ChErpentier, "Pitch-synchronous wEveform processing techniques for text-to-speech synthesis using diphones", Speech CommunicEtion, 9(5):453–467, 1990. [3] H. KEwEhErE, I. MEsudE-KEtsuse, End E. de Cheveigné, "Restructuring speech representEtions using E pitch-EdEptive time-frequency smoothing End En instEntEneous-frequency-bEsed f0 extrEction", Speech CommunicEtion, 27:187-207, 1999. [4] V. HohmEnn, "DynEmic compression in heEring Eids bEsed on En Euditory model", JournEl of the EcousticEl Society of EmericE, 123:3165, 2008. [5] V. Colotte End Y. LEprie, "EutomEtic enhEncement of speech intelligibility", in Proc. 2000 IEEE InternEtionEl Conference on Ecoustics, Speech End SignEl Processing (ICESSP), vol. 2, pp. 1057-1060, 2000. [6] D. REsetshwEne, J. Boston, J. DurrEnt, S. Yoo, C.-C. Li, End S. ShEimEn, "Speech enhEncement by combinEtion of trEnsient emphEsis End noise cEncellEtion", in Proc. DigitEl SignEl Processing Workshop End IEEE SignEl Processing EducEtion Workshop (DSP/SPE), pp. 116-121, 2011.