Edit model card

RVC okiba (随時モデルを追加しています: More models are uploaded regularly)

しばらく忙しいので更新停止中です(I'm busy now, so currently update is stopped.)

人気投票・アンケートへご協力ください (Please participate in the popularity poll and survey.)

English

Text-to-Speech Demo here!

Update History

A collection of RVC v2 models (with index files) trained using approximately 1 hour (per model) of high-quality Japanese voice data of moe characters.

Samples can be found in the table below. (Japanese voice-change samples here)

  • There are currently 63 girl voice models (A-K3) and 6 male voice models (man-A - man-F) (Will be updated regularly, and often epochs are updated to better version)
  • The model names are unordered and do not carry any meaning.
  • Epochs are adjusted for voice-changing purpose, but singing is maybe possible as samples at some quality.

Please use the data provided by this model at your own risk.


RVC置き場

モデルのダウンロードはこちらから

Text-to-Speech(テキストからの音声合成)のデモはこちら

更新履歴

RVC v2のモデル集(index付き)。 ボイチェンで実際に使用したサンプル(男声から変換)はこちらから、また通常サンプルは下の表から聴けます

  • 現在女性63モデル(A-K3)に男性6モデル(man-A - man-F)(随時更新します、またエポック数をたまにより良いバージョンに置き換えることもあります)
  • モデル名は順不同で意味はありません
  • 主にボイチェン用途を想定にエポックの調整をしています(が歌唱もサンプルの通りある程度はできると思われます)
学習詳細
  • 学習データ: 高品質な日本語発話データ、歌は無し。1ファイルの長さは4秒以上~多くても10数秒程度、無音カットやらの前処理はしていません。
  • データセット量: 1モデルにつき基本は合計60分弱、素材が足りなかったときは30分~
  • エポック数: 100-300エポックあたりから良さそうなものを選んだもの

注意事項

使用は自己責任でお願いします。

出力サンプルと雑感 (Samples and comments)

ボイチェンで実際に使用したサンプル(男声から変換)は別ページにまとめてあります。

変換前音声 (Input data)
  • 発話 (Japanese speech)

  • 歌 (Japanese child-song)

出典:sample jvs002, JVS corpus, sample_jvs001, JVS-MuSiC

出力設定

RVC v2の推論タブでの変換

  • ピッチ抽出: harvest
  • ピッチ調整: 発話はjvs-samplesのファイル名に記載(記載なしはピッチ0)、歌唱は女性モデルは+12、男性モデルは0で統一
  • index使用率: 発話は1、歌唱は0.75
  • 何か保護するアレ: 0.33(デフォルト値のまま)

女性モデル (Girl models)

  • 正直声のコメントの語彙が尽きてきた
  • 「高め」「低め」は、(学習データの声の高さが高め・低めなので、)「高い声(ピッチ)と相性がいい」「低い声と相性がいい」程度の意味です。
  • 正確な声質や詳しい個人的な感想・5段階評価はボイチェンサンプル音声のページをご覧ください。
Name Speech Song Comment
A ハスキーダウナー系、低め
B 癖なく明るい
C 吐息混じり、ちょい低め
D 元気、高め
E ウィスパー、少し特徴的
F ちょい低め、ちょい微妙かも
G ナレーターのような声、ちょい微妙かも
H さわやか、ツンデレ風味、ちょい高め
I 元気、やんちゃ、特徴的
J ダウナー、低め、特徴的
K 明るく朗らか、ちょい高め
L 明るく元気、ちょい高め、ちょい微妙かも
M Iと似てる、Iより癖無し
N Dと似てる、Dよりちょい幼い
O 高め、明るく元気
P ショタボ
Q 朗らかで響く声
R はっきりした声、ちょい低め
S 低め、ダウナー、ちょい微妙かも
T 低音に強い、ちょっと特徴的
U 澄んだ声、ちょい高め、特徴的
V 凛とした声、ちょい高め
W かなり高いロリ声
X Oと似てるがOより低く落ち着いてる
Y 元気で明るい声、適度な高さ
Z Fと似ている、低く目で落ち着いてたぶんFより質高い
AA ほどほどの高さ、包容力のある声(?)
BB 高め(低めもイケる)、甘えた感じ
CC 低め、中性的な女子声
DD かなり高くてたどたどしい声
EE 適度な高さ、優しい声音
FF Eと似てる、より高く幼い
GG ちょい高めの元気ではっきりした声
HH ちょっと低めで大人なはっきり明朗とした声
II ちょい高めで吐息混じりで特徴的
JJ Uと似てる、より低めで落ち着いた感じ
KK 高く響くちょい特徴的
LL Cと似てる、高め優しげ癖あり
MM ほどよい高さ、透明、飾らないけどかわいい
NN ちょい高め、舌っ足らず感
OO 低めの大人のお姉さん
PP ちょい高め、特徴的舌っ足らず感
QQ ちょい低め、ジト目声感
RR ちょい低め、強気な感じの女の子
SS 高め、儚げ、質微妙かも
TT ほどよい高さ、ちょい中性的?
UU 高め、包容力あるけど若い
VV ほどよい高さ、ツンデレ風味
WW 低め、強気なお姉さん
XX 高めだけどしっかりした声
YY 低めの女性のかわいい地声感
ZZ すごく高め、おどおど声、極端に音域がせまい
AAA ほどよい高さ、ちょっと演技がかったかわいい
BBB 低い、D・Nと似た声、ボーイッシュ?
CCC ちょい低めだけど高め声もいける、落ち着いてるけど少女な声音
DDD ちょい低め、ちょい強気な明朗な口調
EEE 高め、柔らかく演技したふんわり声音
FFF 低め、ダミ声演技声
GGG 高め、アニメ声のような特徴的な声音
HHH 高め、幼いロリ声ロリ発音
III 高い元気なアニメ声
JJJ 女性の演じる少し芝居がかった男性声
K3 程よい高さ

男性モデル (Male models)

Name Speech Song Comment
man-A 渋いおっさん
man-B 低めの男
man-C チャラそうなお兄さん
man-D 低め、ぶっきらぼう男
man-E キザっぽい男
man-F 優しそうなお兄さん
Downloads last month
0
Hosted inference API

Unable to determine this model’s library. Check the docs .

Spaces using litagin/rvc_okiba 5