ボーカルプロンプト辞典 (Vocal Prompt Dictionary)
カテゴリー1:性別・声域 (Gender/Vocal Range)
声の基本的な高低や性質を決定します。
Male Vocal
: (男性ボーカル) – 最も一般的。Female Vocal
: (女性ボーカル) – 同じく最も一般的。Child Vocal / Kid Singer
: (子供のボーカル) – 純粋さやイノセンスを表現したい時に。Androgynous Voice
: (中性的な声) – 性別を特定しない、ユニークな雰囲気に。Deep Voice
: (低い声) –Male Vocal
に加えることで、より重厚感を強調。High-pitched Voice
: (高い声) –Female Vocal
やMale Vocal
に添えて、より高く突き抜けるような声を狙う。Baritone
: (バリトン) – 男性の中低音域。Deep Male Vocal
より音楽的に具体的。Tenor
: (テノール) – 男性の高音域。Alto
: (アルト) – 女性の低音域。落ち着いた雰囲気に。Soprano
: (ソプラノ) – 女性の高音域。オペラやクラシカルな表現で強力。Countertenor
: (カウンターテナー) – 裏声(ファルセット)を使って女声パートを歌う男性歌手。非常に特徴的で美しい響き。
カテゴリー2:歌唱スタイル (Singing Style)
ボーカリストがどのような音楽的訓練を受け、どう歌うかの様式です。
Pop Singer
: (ポップシンガー) – クリアでキャッチーな歌い方。最も万能。Rock Singer
: (ロックシンガー) – パワフルでエッジの効いた歌い方。Rapper
: (ラッパー) – リズミカルに語るスタイル。Folk Singer
: (フォークシンガー) – 物語を語るような、素朴で誠実な歌い方。Soulful Singer
: (ソウルフルなシンガー) – 魂を込めた、感情豊かな表現。R&Bやゴスペルで多用。R&B Singer
: (R&Bシンガー) – フェイクやビブラートなど、技巧的で滑らかなスタイル。Jazz Singer
: (ジャズシンガー) – 即興的でスウィング感のある歌い方。Scat Singing
: (スキャット) – “ドゥビドゥバ” のように意味のない音節で即興的に歌うジャズのテクニック。Opera Singer
: (オペラ歌手) – クラシックの発声法に基づいた、非常にパワフルでドラマチックな歌唱。Musical Theatre Singer
: (ミュージカル歌手) – 物語の登場人物として、明瞭な発音で感情を表現する歌い方。Enka Singer
: (演歌歌手) – 日本特有の「こぶし」を効かせた情念の深い歌唱スタイル。Screamo / Shouto
: (スクリーモ/シャウト) – 叫ぶような歌唱法。メタルコアやハードコアで使われる。Mumble Rap
: (マンブルラップ) – 意図的に不明瞭な発音でぼそぼそと呟くようなラップスタイル。Gregorian Chant
: (グレゴリオ聖歌) – 古代の教会音楽。単旋律で厳かな雰囲気。
カテゴリー3:声の質感・歌い方 (Vocal Timbre/Technique)
声そのものの物理的な特徴や、細かい歌唱技術を指定します。
Clear Voice
: (クリアな声) – 澄んでいて聞き取りやすい声。Powerful Voice
: (パワフルな声) – 声量があり、力強い。Soft Voice
: (柔らかい声) – 優しく、穏やかな声。Whispery Voice
: (ささやくような声) – 息が混じった、囁き声に近い歌い方。親密さや秘密めいた雰囲気に。Breathy Voice
: (息漏れの多い声) –Whispery
に似るが、より歌唱的。セクシーさや儚さを演出。Husky Voice
: (ハスキーボイス) – 少し嗄(か)れた、しゃがれ声。独特の色気や哀愁を帯びる。Raspy Voice
: (しゃがれた声) –Husky
よりもさらに嗄れが強い、ザラついた質感。ロックシンガーなどに。Falsetto
: (ファルセット) – 裏声。男性が女性のような高い声を出す時など。浮遊感や繊細さを表現。Vibrato
: (ビブラート) – 声を震わせるテクニック。豊かな感情表現に繋がる。Smooth Voice
: (滑らかな声) – 引っかかりがなく、流れるような声質。Monotone
: (単調な) – 抑揚をつけず、平坦に歌うスタイル。無機質さや脱力感を表現。Nasal Voice
: (鼻声) – 鼻にかかったような特徴的な声。Growl
: (グロウル) – うなるような低い声。デスメタルなどで使われる。
カテゴリー4:人数・ハーモニー (Number of Voices/Harmony)
何人で、どのように声を重ねるかを指定します。
Solo Vocal
: (ソロボーカル) – 一人での歌唱。Duet
: (デュエット) – 二人での歌唱。男女、女声同士など様々。Trio
,Quartet
: (三重唱、四重唱) – 3人、4人での歌唱。Choir
: (合唱団/クワイヤ) – 大人数での合唱。荘厳さや一体感を出す。Unison
: (ユニゾン) – 複数の人が同じメロディを歌うこと。力強さが出る。Harmonized Vocals
: (ハーモニー) – 複数の人が異なる音程で、和音を奏でながら歌うこと。Backing Vocals / Background Harmonies
: (バッキングボーカル/ハーモニー) – 主旋律を支えるコーラス。Acapella
: (アカペラ) – 伴奏なしで、声だけで音楽を構成するスタイル。Call and Response
: (コールアンドレスポンス) – 一人が歌ったフレーズに対し、別の人が(または大勢が)応える形式。Gang Vocals
: (ギャングボーカル) – 大勢で叫ぶように歌うパート。パンクロックなどで一体感を出すために使われる。
カテゴリー5:言語 (Language)
歌詞やボーカルの言語、または非言語的なスタイルを指定します。
Japanese Vocals
: (日本語のボーカル)English Vocals
: (英語のボーカル)Korean Vocals
: (韓国語のボーカル)Wordless Vocals
: (歌詞のないボーカル) – “アー” や “ウー” といった声でメロディを歌う。Humming
: (ハミング) – 口を閉じて鼻歌のように歌うこと。優しく、内省的な雰囲気に。Scat
: (スキャット) – 意味のない音節で即興的に歌うスタイル。Nonsense Language / Fictional Language
: (意味のない言葉/架空言語) – 造語で歌わせることで、特定の文化に依存しない、幻想的な雰囲気を作り出す。Chanting
: (チャンティング/詠唱) – お経や呪文のように、一定の音程で言葉を繰り返すスタイル。
カテゴリー6:感情表現 (Emotional Delivery)
声に乗せる感情のニュアンスを細かく指定します。
Emotional
: (感情的な) – 感情がこもっている。Passionate
: (情熱的な) – 強い想いを込めて。Sorrowful / Mournful
: (悲しみに満ちた/嘆き悲しむ) – 深い悲しみを表現。Joyful / Cheerful
: (喜びに満ちた/陽気な) – 楽しさや喜びを表現。Angry / Aggressive
: (怒りを込めた/攻撃的な) – 怒りやフラストレーションをぶつける。Calm / Gentle
: (穏やかな/優しい) – 心を落ち着かせるような歌い方。Haunting
: (心に残る、忘れられない) – 美しくもどこか不気味で、耳から離れないような表現。Melancholic
: (メランコリックな) – 物憂げで、切ない悲しみ。Sorrowful
より静的。Hopeful
: (希望に満ちた) – 未来への希望を感じさせる。Intimate
: (親密な) – すぐそばで語りかけるような、距離の近い表現。Dramatic
: (ドラマチックな) – 劇的で、物語性を感じさせる大げさな表現。Playful
: (遊び心のある) – 楽しげで、いたずらっぽいニュアンス。Tender
: (愛情のこもった) – 愛おしむような、優しい歌い方。Detached / Robotic
: (無関心な/ロボットのような) – 感情を排した、無機質な歌い方。
カテゴリー7:役割・機能 (Role/Function)
曲の中でボーカルが担うパートや機能を指定します。
Lead Vocal
: (リードボーカル) – 主旋律。Backing Vocals
: (バッキングボーカル) – コーラス、ハモリ。Ad-libs
: (アドリブ) – 間奏や後奏で即興的に挿入されるフェイクやシャウト。Spoken Word
: (スポークンワード) – 歌ではなく、詩を朗読するように語るパート。Narration
: (ナレーション) – 物語を語る。Vocal Chops
: (ボーカルチョップ) – ボーカルの音声を細かく切り刻み、再構築して楽器のように使うEDMのテクニック。Hook
: (フック) – 曲の中で最も耳に残りやすい、キャッチーな部分。
カテゴリー8:音響処理・エフェクト (Sound Processing/Effects)
録音後の加工を指示することで、特定のサウンドを作り出します。
Autotuned Vocals
: (オートチューンボーカル) – 音程を機械的に補正した、いわゆる「ケロケロボイス」。Vocoder
: (ボコーダー) – ロボットボイス。Distorted Vocals
: (ディストーションボーカル) – 歪ませた声。ロックやインダストリアルで多用。Heavy Reverb
: (深いリバーブ) – 広い空間で歌っているような強い残響。幻想的な雰囲気に。Delay / Echo
: (ディレイ/エコー) – やまびこのように声が繰り返される効果。Lo-fi Vocals
: (ローファイボーカル) – AMラジオから流れるような、少しこもったレトロな音質。Telephone Effect
: (電話エフェクト) – 電話越しに聞こえるような、中音域が強調された音質。Bitcrushed Vocals
: (ビットクラッシュボーカル) – ファミコンのような、粗いデジタルサウンド。Filtered Vocals
: (フィルターボーカル) – 特定の周波数帯をカット/ブーストし、くぐもった音やラジオボイスのような音を作る。Muffled Vocals
: (マuffledボーカル) – 壁の向こうや水中から聞こえるような、こもった音。
プロンプト作成のヒント
- 組み合わせる: 最も重要なのは、これらの要素を複数組み合わせることです。
- 例:
(カテゴリー6)Sorrowful
+(カテゴリー1)female
+(カテゴリー3)breathy
+(カテゴリー5)Japanese lead vocal
- 例:
- シンプルから始める: 最初は2〜3個の組み合わせから試し、徐々に要素を足していくと、それぞれの単語がどう作用するかが分かりやすいです。
- 具体的に:
Singer
よりもPop Singer
、Vocal
よりもDeep Male Vocal
の方が、Sunoはイメージを掴みやすくなります。
「ボーカロイド風」サウンドを生成するためのプロンプト戦略
ボーカロイドサウンドの主な特徴を、先ほどの8つのカテゴリーに当てはめて分解してみましょう。
- 特徴1:人工的な質感
- これは最も重要な要素です。人間にはない、どこか機械的で非人間的な響き。
- 有効なプロンプト:
Synthesized voice
/Synthetic vocals
(合成された声) – これが最も直接的です。Artificial voice
(人工的な声)Robotic voice
(ロボットのような声) – より機械的なニュアンスを強めたい時に。Vocoder
– ロボットボイスの代表格。Daft Punkのようなサウンドにも。
- 特徴2:完璧すぎる音程と滑らかさ
- 機械なのでピッチ(音程)が完璧で、人間特有の「揺らぎ」や「かすれ」が少ない。
- 有効なプロンプト:
Autotuned vocals
/Heavy autotune
(オートチューンのかかった声) – いわゆる「ケロケロボイス」。ボーカロイドの非人間的な音程変化を再現するのに非常に効果的です。Perfect pitch
(完璧な音程)Clear voice
(クリアな声) – ノイズや息遣いのない、澄んだ声を強調します。
- 特徴3:高音域でアニメ的なキャラクター性
- 特に「初音ミク」に代表されるような、高く、若々しく、アニメキャラクターを想起させる声質。
- 有効なプロンプト:
High-pitched female voice
(高音の女性の声)Anime-style vocals
/Anime songstress
(アニメ風のボーカル/アニソンの歌姫) – ジャンルの文脈から声質を誘導する高度なテクニックです。Androgynous voice
(中性的な声) – 人間離れしたキャラクター性を出す際に有効です。
- 特徴4:人間には不可能な超高速歌唱
- 息継ぎを必要としないため、人間では不可能なレベルの高速なフレーズを歌えるのも特徴です。これはプロンプトで直接指定するより、歌詞で再現します。早口で詰め込んだ歌詞を用意することで、Sunoが自動的に高速歌唱を試みます。
実践的なプロンプトの組み合わせ例
これらの要素を組み合わせることで、「Vocaloid」という単語を使わずに、そのエッセンスをSunoに伝えることができます。
例1:王道のボーカロイドポップFast-paced J-Pop, High-pitched female synthesized voice, heavy autotune, clear and energetic
(高速なJ-POP、高音の女性合成音声、強いオートチューン、クリアでエネルギッシュ)
例2:切ない系のボーカロイドバラードEmotional piano ballad, Artificial female vocal, slightly robotic, with heavy reverb
(感情的なピアノバラード、人工的な女性ボーカル、少しロボット風、深いリバーブ付き)
例3:クールなエレクトロサウンドFuture Bass, Androgynous vocoder voice, catchy hook
(フューチャーベース、中性的なボコーダーボイス、キャッチーなサビ)
このように、「ボーカロイド」という結果(現象)を直接求めるのではなく、そのサウンドを構成している原因(要素)をプロンプトで細かく指示するのが、プロフェッショナルなアプローチです。
そして、あなたの「ボーカルではなく楽器として扱う」という視点は、まさに慧眼です。特にVocal Chops
(ボーカルを切り刻んで楽器のように使う技法)などは、ボーカルの楽器的な側面を最大限に利用したテクニックと言えるでしょう。