Yu-An Chung

Publications

UnitY: Two-pass direct speech-to-speech translation with discrete units
Hirofumi Inaguma, Sravya Popuri, Ilia Kulikov, Peng-Jen Chen, Changhan Wang, Yu-An Chung, Yun Tang, Ann Lee, Shinji Watanabe, Juan Pino
ACL, 2023
Speech-to-speech translation for a real-world unwritten language
Peng-Jen Chen, Kevin Tran, Yilin Yang, Jingfei Du, Justine Kao, Yu-An Chung, Paden Tomasello, Paul-Ambroise Duquenne, Holger Schwenk, Hongyu Gong, Hirofumi Inaguma, Sravya Popuri, Changhan Wang, Juan Pino, Wei-Ning Hsu, Ann Lee
ACL Findings, 2023
Autoregressive predictive coding: A comprehensive study
Gene-Ping Yang, Sung-Lin Yeh, Yu-An Chung, James Glass, Hao Tang
IEEE Journal of Selected Topics in Signal Processing, 2022
SSAST: Self-supervised Audio Spectrogram Transformer
Yuan Gong, Cheng-I Jeff Lai, Yu-An Chung, James Glass
AAAI, 2022
w2v-BERT: Combining contrastive learning and masked language modeling for self-supervised speech pre-training
Yu-An Chung, Yu Zhang, Wei Han, Chung-Cheng Chiu, James Qin, Ruoming Pang, Yonghui Wu
ASRU, 2021
PSLA: Improving audio tagging with pretraining, sampling, labeling, and aggregation
Yuan Gong, Yu-An Chung, James Glass
IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2021
AST: Audio Spectrogram Transformer
Yuan Gong, Yu-An Chung, James Glass
Interspeech, 2021
Non-autoregressive predictive coding for learning speech representations from local dependencies
Alexander H. Liu, Yu-An Chung, James Glass
Interspeech, 2021
SPLAT: Speech-language joint pre-training for spoken language understanding
Yu-An Chung*, Chenguang Zhu*, Michael Zeng (*: equal contribution)
NAACL-HLT, 2021
Similarity analysis of self-supervised speech representations
Yu-An Chung, Yonatan Belinkov, James Glass
ICASSP, 2021
NeurIPS SAS Workshop, 2020
Cost-sensitive deep learning with layer-wise cost estimation
Yu-An Chung, Shao-Wen Yang, Hsuan-Tien Lin
TAAI, 2020
(best paper award)
Vector-quantized autoregressive predictive coding
Yu-An Chung, Hao Tang, James Glass
Interspeech, 2020
(best student paper award)
Improved speech representations with multi-target autoregressive predictive coding
Yu-An Chung, James Glass
ACL, 2020
Generative pre-training for speech with autoregressive predictive coding
Yu-An Chung, James Glass
ICASSP, 2020
An unsupervised autoregressive model for speech representation learning
Yu-An Chung, Wei-Ning Hsu, Hao Tang, James Glass
Interspeech, 2019
Unsupervised clinical language translation
Wei-Hung Weng, Yu-An Chung, Peter Szolovits
KDD, 2019
Semi-supervised training for improving data efficiency in end-to-end speech synthesis
Yu-An Chung, Yuxuan Wang, Wei-Ning Hsu, Yu Zhang, RJ Skerry-Ryan
ICASSP, 2019
Towards unsupervised speech-to-text translation
Yu-An Chung, Wei-Hung Weng, Schrasing Tong, James Glass
ICASSP, 2019
Disentangling correlated speaker and noise for speech synthesis via data augmentation and adversarial factorization
Wei-Ning Hsu, Yu Zhang, Ron J. Weiss, Yu-An Chung, Yuxuan Wang, Yonghui Wu, James Glass
ICASSP, 2019
NeurIPS IRASL Workshop, 2018
Unsupervised cross-modal alignment of speech and text embedding spaces
Yu-An Chung, Wei-Hung Weng, Schrasing Tong, James Glass
NeurIPS, 2018
Speech2vec: A sequence-to-sequence framework for learning word embeddings from speech
Yu-An Chung, James Glass
Interspeech, 2018
NIPS ML4Audio Workshop, 2017
Supervised and unsupervised transfer learning for question answering
Yu-An Chung, Hung-Yi Lee, James Glass
NAACL-HLT, 2018
Learning deep representations of medical images using siamese CNNs with application to content-based image retrieval
Yu-An Chung*, Wei-Hung Weng* (*: equal contribution)
NIPS ML4H Workshop, 2017
Audio word2vec: Unsupervised learning of audio segment representations using sequence-to-sequence autoencoder
Yu-An Chung, Chao-Chung Wu, Chia-Hao Shen, Hung-Yi Lee, Lin-Shan Lee
Interspeech, 2016
Cost-aware pre-training for multiclass cost-sensitive deep learning
Yu-An Chung, Hsuan-Tien Lin, Shao-Wen Yang
IJCAI, 2016

Preprints

SLAM: A unified encoder for speech and language modeling via speech-text joint pre-training
Ankur Bapna*, Yu-An Chung*, Nan Wu, Anmol Gulati, Ye Jia, Jonathan H. Clark, Melvin Johnson, Jason Riesa, Alexis Conneau*, Yu Zhang* (*: equal contribution)
arXiv:2110.10329
SummAE: Zero-shot abstractive text summarization using length-agnostic auto-encoders
Peter J. Liu*, Yu-An Chung*, Jie Ren (*: equal contribution)
arXiv:1910.00998
Towards transfer learning for end-to-end speech synthesis from deep pre-trained language models
Wei Fang, Yu-An Chung, James Glass
arXiv:1906.07307
libact: Pool-based active learning in Python
Yao-Yuan Yang, Shao-Chuan Lee, Yu-An Chung, Tung-En Wu, Si-An Chen, Hsuan-Tien Lin
arXiv:1710.00379