Lester Phillip Violeta

Lester Phillip Violeta

Research Scientist (Speech LLMs & Post-Training)
DubGuild, Tokyo, Japan

lpgvioleta [at] gmail [dot] com
Google Scholar
@lesterphv
github.com/lesterphillip
linkedin.com/in/lestervioleta

I am a Research Scientist at DubGuild in Tokyo, where I work on scaling and post-training speech LLMs for natural conversation. My research interests sit at the intersection of speech generation and LLM post-training: reinforcement learning for spoken dialogue behavior, neural audio representations, and large-scale evaluation methodology.

I received my Ph.D. in Computer Science from Nagoya University at Toda Laboratory under the supervision of Professor Tomoki Toda, where my research on speech synthesis, voice conversion, and speech recognition was published in top speech and audio venues such as Interspeech, ICASSP, ASRU, SLT, and IEEE/ACM TASLP. I was the main organizer of the Singing Voice Conversion Challenge in 2023 and 2025, and I serve on the peer-review committees of conferences such as ASRU, SLT, ICASSP, Interspeech, and IJCNN, and journals like IEEE JSTSP.

I have a deep international background now based in Japan, having done my B.S. in the Philippines and a research exchange in France. Outside of research, I like bouldering (check out this page) and learning Japanese.

News

July 2026

🎯 New blog post: post-training TTS models with reinforcement learning. (in Japanese)

July 2026

📝 New blog post: pre-training methods for speech LLM. (in Japanese)

May 2026

🎤 Our extended SVCC 2025 analysis is now on arXiv!

April 2026

⚙️ New blog post: our 500k-hour audio preprocessing pipeline. (in Japanese)

April 2026

📈 New blog post: scaling our Japanese speech LLM to 8B. (in Japanese)

March 2026

🎓 Graduated with my Ph.D. from Nagoya University!

October 2025

🚀 Joined DubGuild full-time as a Research Scientist!

Education

2023—2026

Nagoya University, Japan

Ph.D. Computer Science

Advisor: Prof. Tomoki Toda

Thesis: Speech Synthesis, Voice Conversion

2021—2023

Nagoya University, Japan

M.S. Computer Science

Advisor: Prof. Tomoki Toda

Thesis: Speech Recognition

2015—2020

Ateneo de Manila University, Philippines

B.S. Electronics Engineering

Thesis: Renewable Energy, Microgrid Optimization

2019

Institut Catholique d'Arts et Metiers Paris, France

Research Exchange Semester

Thesis: Renewable Energy, Microgrid Optimization

Publications

An Extensive Analysis of the Singing Voice Conversion Challenge 2025 Evaluation Results

In Review 2026

An Extensive Analysis of the Singing Voice Conversion Challenge 2025 Evaluation Results

Lester Phillip Violeta, Xueyao Zhang, Jiatong Shi, Yusuke Yasuda, Wen-Chin Huang, Zhizheng Wu, Tomoki Toda

Scaling Japanese Speech Foundation Models and Examining TTS Performance (in Japanese)

Technical Report 2026

Scaling Japanese Speech Foundation Models and Examining TTS Performance (in Japanese)

長谷川直哉, 相田優希, 廣岡聖司, 林春太朗, Lester Phillip Violeta, 大嶽匡俊

The Singing Voice Conversion Challenge 2025: From Singer Identity Conversion To Singing Style Conversion

ICASSP 2026

The Singing Voice Conversion Challenge 2025: From Singer Identity Conversion To Singing Style Conversion

Lester Phillip Violeta, Xueyao Zhang, Jiatong Shi, Yusuke Yasuda, Wen-Chin Huang, Zhizheng Wu, Tomoki Toda

Serenade: A Singing Style Conversion Framework Based on Audio Infilling

EUSIPCO 2025

Serenade: A Singing Style Conversion Framework Based on Audio Infilling

Lester Phillip Violeta, Wen-Chin Huang, Tomoki Toda

Electrolaryngeal Speech Intelligibility Enhancement through Robust Linguistic Encoders

ICASSP 2024

Electrolaryngeal Speech Intelligibility Enhancement through Robust Linguistic Encoders

Lester Phillip Violeta, Wen-Chin Huang, Ding Ma, Ryuichi Yamamoto, Kazuhiro Kobayashi, Tomoki Toda

Pretraining and Adaptation Techniques for Electrolaryngeal Speech Recognition

IEEE/ACM TASLP 2024

Pretraining and Adaptation Techniques for Electrolaryngeal Speech Recognition

Lester Phillip Violeta, Ding Ma, Wen-Chin Huang, Tomoki Toda

A Preliminary Investigation on Flexible Singing Voice Synthesis Through Decomposed Framework with Inferrable Features

Technical Report 2024

A Preliminary Investigation on Flexible Singing Voice Synthesis Through Decomposed Framework with Inferrable Features

Lester Phillip Violeta, Taketo Akama

The Singing Voice Conversion Challenge 2023

ASRU 2023

The Singing Voice Conversion Challenge 2023

Wen-Chin Huang, Lester Phillip Violeta, Songxiang Liu, Jiatong Shi, Tomoki Toda

An Analysis of Personalized Speech Recognition System Development for the Deaf and Hard-of-hearing

APSIPA 2023

An Analysis of Personalized Speech Recognition System Development for the Deaf and Hard-of-hearing

Lester Phillip Violeta, Tomoki Toda

Intermediate Fine-tuning Using Imperfect Synthetic Speech for Improving Electrolaryngeal Speech Recognition

ICASSP 2023

Intermediate Fine-tuning Using Imperfect Synthetic Speech for Improving Electrolaryngeal Speech Recognition

Lester Phillip Violeta, Ding Ma, Wen-Chin Huang, Tomoki Toda

Investigating Self-Supervised Pretraining Frameworks for Pathological Speech Recognition

Interspeech 2022

Investigating Self-Supervised Pretraining Frameworks for Pathological Speech Recognition

Lester Phillip Violeta, Wen-Chin Huang, Tomoki Toda