sumikko.tokyo

espeak chan の日本語 TTS やで?

Warning

This page includes espeak demo texts and some links for pseudo-Japanese alike text-to-speech attempt, which contains malformed and/or sensitive words.

このページには espeak に無理やり日本語の音声合成をさせるために、 意図的に調整した造語、単に音素生成のために用いた雑多な単語を含み、 それら一部を不適切、不快に感じる方はいるかもしれません。

espeak ちゃんが何やら言いたいようです。

Attention!

サンプルとして音声合成結果の mp3 ファイルもありますが、 espeak の特性と帯域利用量の観点から、 皆様各位の Linux 環境などでの espeak による合成発声に ご協力いただけると幸いです。

espeak ちゃんで遊ぼう

目次ページでも紹介しているとおり、 espeak は自由かつ簡単に利用できるテキスト読み上げ、 text-to-speech (TTS) ソフトウェアです。

このページでは「espeak ちゃんのカタコト日本語合成: 第一回」の 対象テキストファイル (ASCII テキスト) を引用しつつ、 適時読み上げの内容などについてコメントしています。

espeak ちゃんのカタコト日本語合成:第一回 の視聴 (?) 方法

  1. 対象テキストファイルをダウンロード
    • 上のリンクから名前をつけて保存なりで。
  2. espeak に読み上げてもらう。
    • 実行可能にして直接全部を皆様の espeak に読み上げてもらう。
    • 皆様の espeak の stdin なり -f オプションで読み上げてもらう。
    • (非推奨) 合成音声サンプルファイル (mp3) をウェブ上で再生する。

Note

上述理由のため、一行目には設定済みオプションを含めた GNU/Linux における espeak 起動用の行が含まれています。

不安な方は実行させないで espeak に普通 (?) に読んでもらってください。

本編

これ以降は「音声合成を再生しつつ読んでいただく」ことを前提にしています。:

#!/usr/bin/env -S espeak -v en+f4 -p 90 -s 150 -g 0 -x -f

注:これは GNU/Linux で直接ファイルを espeak に読んでもらうための行です。:

ladies and gentlmen, I am espeak,
options v en plus f4, p 90, s 150, and g is 0.

warning: This espeak demo file contains
many malformed words and may contain
some sensitive English words,
just to produce pseudo-Japanese alike
text-to-speech output, with some jokes and junks.

ここは全世界の皆様に向けた注意点です。:

zen nihong no fu jothy nalavy knee hen tie shocken

ん?:

e speak yah day?
op shown seteigh wa,
v, gah, enu, plus, ef, yong,
p, wah, queue jeu,
unp day, s, co leh, hiyak go jeu,
key may teh gah, g! 0, teth talko ya.

Only option g is important.

自己紹介ですね。

要するに -g 0 以外はお好みでいいです。

ただキンキン声のエセ関西弁をお楽しみいただくには -v en+f4 -p 90 が必要です。:

let's play with espeak.

ee speak day asob day?

text to speech, reeyak she teh, T T S,
moji war, ko eigh knee sulu mong ya.

ご覧のように英語 (?) テキストを合成音声で読み上げます。:

iro iro aluno, shit lu yahlaw?
espeak wah die seng pi nang ya day?

e e ko a no, koh high niwaka nah wan kedoh,
foo lee no, jiq yaw you tala, ee speak yalo?
fes tea bal? doko yah? oma two leak ah?
open jay talk? si langa nath.

いわゆる各種 OS などの読み上げ機能さんや、ボイロさんのことかな。

festivalopen-jtalk は Debian でもご利用頂けます。:

nah ma moo gi nah ma go may nah ma ta ma go

Go. Let's go.

horn ah, eek day?

ah e wou eigh oh,
ka key ku kay koh,
sa shi su say so,
ta chee tu teh toe,
nah knee nuu nay noh,
hah hiee huu hay haup,
ma mee moo may maw,
yah yiee you yeah yo,
lah lee luu lay loh,
wah, woh, unp.

おっと?五十音からして、明らかに、おかしい

unp?
roma g oka sea? key no say yah!

ローマ字でないことは確かですが、大半は英語でもない。

そう、あいうえおの五十音を espeak -v en で発音するには こういう感じのごまかしが必要 なんですね。:

ga gi gu gay go,
za thee zoo zep zo,
dah zie zuu day doh,
pah pea puu pay poh,
bah bea boo bay bow,

英語「的」なフレーズはそれっぽく解釈されて発音されるので、 こういう並びになるわけです。

ほしい発音が得られるならぶっちゃけ、なんでも構わない。

two gi e cocah?

e lah hah knee haup hay toe chee lee nuu luu woh,
wah ga yoh ta lay zoh tuu nay nah lah moo,
wou yiee noh oh ku ya ma kay huu koh eigh teh,
ah sa key you may me shi yoh hiee maw say zoo

eigh yang? g ga disan yah.

いろは歌 (いろは・うた "Iroha Uta")

いろはにほへと ちりぬるを (色は匂えど 散りぬるを)

わがよたれぞ つねらぬむ (我が世 誰ぞ 常ならむ)

うゐのおくやま けふこえて (有為の奥山 今日越えて)

あさきゆめみし よひもせず (浅き夢見し 酔ひもせず)

いろは歌も、こうなる。:

horn nah, her yaw sulu day?

ye lawha knee haup hay toe cheelee nuuluu woh,
wah gayo talayzoh two naynahlam,
wou yiee noh oak yama kayf koeigh teh,
asaki you may meeshi, yo hiemo saizu

おなじ「いろは歌」でも、それっぽくなる単語をでっち上げると、 大体の場合その部分の発音速度が上がります。

またあえて別単語にすることでイントネーションも 調整できる余地がすこしはあります。:

solay karah?

toe nari no caku hah yoh ku kaki ku wou caku dah

wait.

caku? cathkoo? cathkoo! hen ya nah?
cheey sa na yah, you, yaw, moozooy wah.

違和感が。

espeak ちゃんは滑舌最高なのでいいまつがいではありません。:

kyoto teki toe jaw dah nah?

unp? matt a ya.

(編集注:「強敵」を「京都的」って言い間違えてない ? ):

key awe oh teki. two yawy.

tokyo, e ale no knee,
kyoto, quiyaw toe, yeah hen.

akima hen nah.

あきまへん。京都、きょうと、その kyoto が合成できない、 という前に kyo のローマ字表記が狙った声にならない。

espeak -x

テキストファイルをダウンロードしてやっている方には お分かりかと思いますが、 ここは -x オプションによる音素記号表示で 見て取れます。

なお、地味に「ん」も単独発音させにくいんですよね。:

key, toe, cheesana yaw, kolay nigateh ya.

key awe teki ya.

強敵や。:

cath key Q kay quiyaw,
cath key q kay key awe.

akan.
cheey sa na yah, you, yaw.
len shoe yah!

kyo を発端に「ゃ/ゅ/ょ」がキツイと発覚。:

cath, q, key awe,
shut, shooth, shoth,
chat, chew, chaw,
niya, new, niyaw,
he ya, hew, he yo,
me ya, mew, me yo,
liya, leu, liyo.

類似形がほぼ軒並み壊滅です。:

nalu hoodo nah? you, wa, e kel wa.
yah, toe, yaw, ga car die ya nah.

暫定的に「英語ぽい造語複数単語で無理やり」通している。 課題やなぁ。:

kolay, eigh go g show yato, hatu on deki hen?
hatu on deckey hen no car?

まだ慌てる時間じゃない。:

kyonew? key yo new? qui yaw new! quiyaw new!
hinn new, bee new, quiyaw new!
mana eater tow quiyaw new!
seng taq e tar tow quiyaw new!

ちょっと 何言ってるか わかりません。

akkima hen, akanwa kolay.

wai, ee speak no source code maday yondahn yaday?
show thee key, ee woo teh na, sap parry ya.

はい。読んだんです。多分。:

tadath, nihon go de hana she takkatann ya.
demo nah, loma zie demo, eigh go demo nine ya.
go round no ary sama ya.

ご覧の有様だよ!:

key horn techinywa,
ee speak wah, eigh go day, ninnshiki su lunn ya.
nihon go wah, mee tai o nann ya.
loma thee, akanno ya.
woomak dama sana a kann.

so ray ga, koh no zah maya.

うまく espeak を騙さなアカンのやけど、 このザマや。:

espeak yaw no nihon go dictionary toe voice file,
kolay ga array bar, ka tellen ya, tabun.
woo chee, geejute two tekiny, akan wap.
mendoi make, oh sugi day, yameta wa.

wakah looh knee key otta la,
nihon go g show, two coo teh ya.

(注) sumikko.tokyo としてはガチで予定ありません。 理由は目次ページでも述べたとおりで、 仮にこれをきちんとやっても「ローマ字発音対応」までです。多分。:

zenn sekaiga nuc day? honma yap!
she lan kaydo.

しかし仮に espeak -v ja誰 か により華麗にパッチされ、 upstream にマージされれば、全世界が泣くのは必至でしょう。

知らんけど。:

maw taskalah nigh zoh?

to be continued, tu zoo coo day?

なんてことだ。もう助からないぞ?[次回へつづく]

Tip

下のリンクや右上の左右のリンクで繋がってます。

Published: (Modified: )