荒诞马戏魔术师

本次带来的是来自“催眠红茶”团队制作的中文付费催眠音声《荒诞马戏魔术师》(R18)的评测,关于催眠音声这一类型的介绍可以参考《中文音声现状》中催眠部分。

此作品是男性向(CV是女,给男性听的意思)作品。声优是CV凊泠。台本应该是改编作品,融合了日文经典音声(催眠術師の悪戯 RJ214295催眠音声-ハニーベル RJ157644 )。音频主要是古典催眠+关键词+数字的催眠音声。CV音色是明亮的少女音(两种不同角色)。音频应该是双声道录制,后期混音立体声,包含效果音。


结构

尽管是催眠音声,作品依然以一个情景剧的形式开篇。故事开始,男主(听者)顺着公告来到马戏团,可惜表演还没开始。魔术师小姐姐(CV凊泠)发现了男主,决定邀请男主观看她们的彩排,似乎这个神秘的马戏团并不简单……

【以下文字有剧透】


导入部分

开始的时候,我们的男主【十分幸运】的观看并参与魔术师的彩排,开始常规的放松与调整。

一些古典催眠的常见技巧,数字上升与下降结合肢体指令。让听者进入比较平静专注的状态。这里后期把音轨一分为二,让数字和指令分开。让听者非常容易的跟随指令。

一…… 把左手……二……舒服地抬起来。

然后魔术师慢慢关联听者的舒适感与自己的声音绑定,使用一些简单的暗示词加深催眠。

你应该很喜欢这样的感觉吧,喜欢服从我的指令,乖乖被我控制。

让听者放松戒备,这一轮基本的古典催眠,【听者可以逐渐放松肌肉】【对催眠初学者十分友好的引导】,结合暗示关键词,让听者通过关键词能够进入比较深的催眠状态。

加深

加深部分使用的暗示词是【睡】,然后【言语服从】的加深。这里魔术师(CV凊泠)演出效果非常好,语气和神态演绎的非常有代入感。各种形容词和身体部位的描述,非常准确自然。

敏感度加深

通过描述具体身体部位,让听者比较容易的进入恍惚的状态,进而加深心理暗示。【然后魔术师不出意外的卸除了伪装】。

反转让听者感觉到被欺骗,但由于男主是不能动的状态,所以被语言戏弄,无法反抗的身体被魔术师的言语控制,听者逐渐被快感所覆盖。

玩法

进入深度催眠后,音声计划用多声道复数音声【幻影】进行【言语攻击】。主引导声音角色进行指令,副声音角色扮演被控制的人偶,让听者带入被控制的角色,然后用之前的关键词和音效作为爆发点,最后【理性吹飞~】。

整体的高潮部分让我看到许多日系作品的影子。除了复数音声,角色反转外,里面的副音声所扮演的被催眠状态,与当年的日文神作(催眠術師の悪戯 RJ214295)类似。不过玩法的时长相比原作稍短。并且原作中的角色声线区分度比较明显。不过整体来说算是非常好的演绎。

此外,该作品又结合了帽子屋当年的神作(催眠音声-ハニーベル RJ157644),打算用铃声作为关键音效。不过多少和原本的催眠框架不那么契合。

【多个暗示的矛盾】一般来说,催眠音声作品的关键词或者关键音效不建议太多,否则听者思绪无法处理多个目的近似的词汇或音效,进而可能会感到困惑。【铃声、响指、关键词作用太相似】

【复数音效】高潮部分其实可以添加更多复数音声,例如多音轨齐发,多音轨错位,语义错位,也可以添加舔耳或者吐息音效等。否则听者对【幻影】的期待落空后,容易感到失望。

最后,魔术师期待男主的下次光临。【Happy End】


评价

优点

+ 古典催眠+改编台本

+ CV演出非常优秀(吐字、节奏、语气)

+ 录音非常精良

+ 个人十分喜欢CV的音色

缺点

– 催眠的后期结构有些失衡

– 缺少必要的多音轨后期和音效


作品信息

时长: 44:39

CV:凊泠
台本:水印烛
后期:催眠红茶

推荐度

■■■■■■■■ □□  8分

B站试听:https://www.bilibili.com/video/BV1gT411B7HZ/

YT试听: https://www.youtube.com/watch?v=HdeTps3FHTg

爱发电:https://afdian.net/item/adb8d43ccfb511ed8d5852540025c377

AI技术杂谈

这个博客已经好久没更新了,一来生活上的琐事比较繁忙,二来随着AI技术的革新,沉迷于AI的二次创作。不过现在好不容易终于有了点闲暇时间,会继续更新音声评测。不过在这之前,还是总结一下我发现可能会改变ACG领域的一些AI技术。(本篇文章多数为个人的一些浅见)

说起AI革新,2022年以来,有3个方向比较令人在意:AI绘图,AI语音识别,和AI文字生成

AI 绘图

先说AI绘图,一般来说AI绘图指的是利用人工智能技术来生成艺术图像的过程。它使用深度学习模型学习大量图像数据,然后利用这些数据生成新的图像。而对于我目前的研究,发现大致上绘图使用的都是Pre-train预训练好的模型,然后在其基础之上进行Fine-tune微调。

其中最有代表性的就是Stable-Diffusion (简称SD). Stable-Diffusion是一种用于生成高质量图像的生成模型。它利用扩散过程来平滑噪声图像,并逐渐增强图像的细节,从而生成逼真的图像。这种方法在处理高分辨率图像和动态图像时表现出色,已经被广泛应用于计算机视觉和计算机图形学领域。

其优点包含:

  1. 生成的图像质量高,细节丰富,视觉效果逼真。
  2. 支持生成高分辨率的图像,可以生成256×256、512×512甚至更大的图像。
  3. 生成的图像具有多样性,可以通过调整生成过程中的参数来获得不同的结果。
  4. Stable-Diffusion使用基于扩散过程的方法生成图像,相对于传统的生成模型,它在处理高分辨率和动态图像时表现更好。

并且其支持多种常见模型,包含:

  1. Gaussian Diffusion Process (GDP)模型,是最基础的模型,采用了随机噪声和扩散过程生成图像。
  2. Denoising Diffusion Probabilistic Models (DDPM)模型,在GDP模型的基础上引入了去噪过程,使得生成的图像更加平滑和真实。
  3. Score-Based Generative Modeling (SBGM)模型,采用可微分的评分函数来生成图像,可以更好地控制生成图像的质量和多样性。
  4. Diffusion Autoencoder (DAE)模型,结合了自编码器和扩散过程,可以在保持图像质量的同时,更好地保留图像的语义信息。

虽从学术领域来讲,这个技术已经不是新鲜事,但众多网友和爱好者不断完善,创建了许多许多免费的开源框架。例如https://github.com/AUTOMATIC1111/stable-diffusion-webui

玩家可以自己在本地或者云端搭建Stable Diffusion服务器,然后通过网页端进行AI模型调试于绘图。其中的效果在各大AI预训练模型上有显著应用。例如https://civitai.com/,AI绘图爱好者可以很容易找到自己喜欢的模型(.ckpt, .safetensors),然后安装在SD上进行绘图。

不过毕竟是深度学习模型,许多参数和模型内部原理属于(Black-box)黑匣子模型,所以很难直接解释原理。因此需要玩家不断通过给AI下达指令(Prompt)然后通过调参去生成对应图像。其中也不乏诞生出“Prompt Engineer”这样的新岗位,玩家不断修改对应正负提示词(Prompt Keywords)让AI产生自己想要的图片。所以很多人自称自己是“AI融合师”,“AI炼金术士”。

不过AI做图的几个难点在于:

1. 时间成本。调参经常花费大量时间,而AI生成的图片,往往不尽如人意(视角问题、错位、手指等),此类问题虽然可以通过调整Negative Prompt参数应对,但依然没有一个可以快捷高效的办法,一旦模型更换,对应的参数和关键词也要更换。

2. 金钱成本。深度学习(Deep Learning)部署服务器对显卡(GPU)要求比较高,而在矿潮消退之后,算力高的显卡依然价位走高,让一般玩家望而却步,而云端GPU、TPU往往使用共享资源,价格不菲的情况下,有些公司还会检测实验项目的道德与法律因素,因此账号被禁时有发生。

所以,不管怎么说,这是一个对于新时代的玩家的一个十分有趣的技术革命(DLsite上面已经有大量用AI生成图片的游戏了),我也十分期待今后有越来越多的人开发更高效的模型并提高作图体验。

AI语音识别

语音识别技术其实已经十分成熟,各大语言的识别准确率已经非常优秀。不过以前都是商业领域的范畴,很多公司并不会免费提供API端口让用户体验高质量的音频识别。不过自从OpenAI的崛起,让普通用户得以免费的使用这个技术。我所推荐的是大名鼎鼎的Whisper (https://github.com/openai/whisper)。可以通过预训练模型,结合GPU显卡加速,实现智能识别视频、音频中的文字,然后生成文本。

这里我推荐的是:WhisperDesktophttps://github.com/Const-me/Whisper

这个免费开源工具提供了一个可以本地部署的图形界面(GUI),然后用户可以自定义识别语言(中文、英文、日文、韩文等等)和模型(可以自行下载.bin格式GGML模型),然后AI就可以自动生成带时间轴的字幕文字(.srt、.txt格式)。除了可以提高自媒体时代挂载字幕的问题,还可以应用到音声领域:

  1. 可以生成日语或者英语字幕,然后通过其他AI工具进行翻译,这样可以使得许多听不懂外语的玩家,也能很好的享受到高质量音声。
  2. 生成的字幕文件准确率比较高,我个人测试了一下,准确率大约85%左右。因此对于音声制作者或者汉化组来说,可以很方便的提取文本,进行校对润色或者二次创作。
  3. 接下来,也可以尝试使用TTS(Text-to-Speech)文本转语音技术,让AI读出文字,可以聆听部分对于声优演出要求不那么苛刻的作品。
  4. 也可以通过AI技术,让AI训练好自己喜欢的声优作品,然后克隆(Clone)音声。不过这个技术目前有些瑕疵,并且各大网站由于道德和法律原因,这个技术被禁用。(暂时按下不表)

总而言之,新技术当然也带来除开道德法律问题,与之对应的商业纠纷也会越来越严重。例如版权、洗稿等问题(律师函发送中……)

总而言之,如果是非盈利使用,我个人还是十分推荐各大ACG爱好者尝试这个工具!

AI文字生成

2022年最大的革命技术,毋庸置疑是ChatGPT!简单来说,ChatGPT是一种基于自然语言处理技术的对话系统,它是由OpenAI公司开发的一个大型语言模型,基于GPT(Generative Pre-trained Transformer)系列模型架构,采用海量语料的无监督学习方式进行训练。这种“大力出奇迹”般的语言模型标志着AI时代,变成了各大公司拼算力、财力的新纪元。不够对于一般消费者,这个已经训练好的语言模型非常好用。各大网站和技术爱好者都在不断挑战这个文字AI,其中不乏相关从事人员用其进行工作与生产(写代码、改文章、查资料等)。

对于ACG领域而言,许多工作已经变得十分轻松。不论是文字总结、润色、翻译,都已经相当程度的以假乱真。更不用说衍生而来的文字创作,例如续写小说、文字游戏、角色扮演等。

以翻译为例,ChatGPT的翻译水品已经比当年爆火的DeepL还要优秀,其中可以调整翻译的风格和语言流派,不禁让人震惊!很多游戏和动漫作品已经开始使用ChatGPT进行辅助,效率大幅度提高!

此外,很多网友也尝试用ChatGPT进行R18内容的创作,包括小说创作、续写、角色扮演。虽然说OpenAI已经开始限制R18内容的生成,但众多网友还是找到各种方法绕开检验。其中许多方法不禁让人慨叹网友的智慧!!!

不过,对于这个博客的初衷是音声评测,我个人发现许多可以帮助音声制作者和爱好者的用法。除了之前提到的翻译功能,台本生成其实也是可行的。只不过由于免费ChatGPT的Token限制,使得许多文字的上下文记忆受限,因此还是推荐使用付费版本,自行调用API。此外,即使是付费API,很多文字或者台本的生成也是十分生涩。需要人工修正与后期校对。不过自从我个人沉迷于AI之后,发现生成的作品有时候确实实用度非常高,如果有一个非常良好的台本规划与Prompt关键词设置,其作品的质量应该已经可以达到DLsite的高分水准。更何况,有时候看AI天马行空的创作,对制作者本身,也有许多启发。

不过,使用ChatGPT终究是把自身的需求和数据偏好送给其他公司,不是长远之计。最可靠的方法还是通过用户自身的已有数据集,进行训练。或者根据已经开源的LLaMa模型(https://www.datacamp.com/blog/12-gpt4-open-source-alternativeshttps://ai.facebook.com/blog/large-language-model-llama-meta-ai/),进行微调。让用户有属于自己个人偏好的GPT平台。这样一来可以避免道德法律等问题,二来作品的风格会随着自己的调试与长时间的训练,变得越来越好,越来越有个性。

最后

以上是我个人的一些拙见,尽管AI必将带来许多社会的风险,但风险与收益并存。许多想法还是需要不断实践,才能发掘更多的乐趣。今后或许也会找机会分享一下自己的平台搭建、模型选择等等的心得。也希望众多ACG爱好者也会分享自己的经验,让AI变得更有趣。

三只小猫

本次带来的是中文付费催眠音声《三只小猫》(R15/R18)的评测,关于催眠音声这一类型的介绍可以参考《中文音声现状》中催眠部分。

此作品是男性向(CV是女,给男性听的意思)作品。声优是CV咪啪。台本是原创作品。音频主要是古典催眠+复数音声,即声优分饰多种角色。CV音色有温柔的萝莉音+少女音。音频应该是单声道录制,后期混音立体声,包含效果音/无效果音双版本可供选择。


结构

尽管是催眠音声,作品依然以一个情景剧的形式开篇。故事开始,男主(听者)被三只无家可归的小猫搭讪,即老大喵 、老二喵和老三喵 。三只猫表明没有恶意,得知男主是催眠爱好者,于是打算催眠男主。

【以下文字有剧透】


导入部分

三只小猫轮番言语,男主被称作大块头(大喵),并且似乎很期待的样子。【男主都是勇者转世】

三只小猫声称自己不会有什么坏心思

让听者放松戒备,于是一轮基本的古典催眠,放松调整呼吸。左耳喵提示呼吸,右耳提示放松提示音【常见的睁眼闭眼与呼吸导入】

然后是古典催眠中的引导注意力,放松肌肉,从额头、面部、躯干、肢体、到全身。下坠感+力气消失,放松、舒服等词汇初步挂钩。【听者可以逐渐放松肌肉】【对催眠初学者十分友好的引导】

之后是倒计时催眠状态,因为是多音轨,因此有些许音轨叠加效果。

加深

加深部分使用的暗示词是【喵】,然后【言语服从】的加深。

数字越小,就越舒服

心理暗示和舒服锚定,数字变化和催眠状态加深。【再次唤醒+快速催眠】。

接下来是复数音声带来的【信息过载】,让听者假装/认为催眠状态。由于男主是不能动的状态,所以被语言戏弄而不能反抗,身体的控制权逐渐被快感所覆盖。【三只小猫的小剧场】

玩法

进入深度催眠后,设立【数字敏感度规则】,男主许诺【服从】。随着数字倒计时的逼近,身体变得更加敏感【吐息Play】。多轮倒计时之后,【喵】+【 羞耻Play】+【DIY】,最后【理性吹飞~】。

【催眠恍惚+DIY有些许矛盾】一般来说催眠音声听者进入恍惚状态后应当保持静止状态,以免出戏。

【复数音效】主体部分其实可以添加更多复数音声的优势,例如多音轨齐发,多音轨错位,语义错位等。

最后,作为催眠报酬,三只小猫恰巧需要容身之处。既然男主很满意刚刚的催眠,欣然决定收养这三只小猫【勇者和魔物娘主人】。

结尾有催眠解除+唤醒。完全清醒之后,猫の大团圆~ 【Happy End】


评价

± 对于【猫】/【喵】的喜好因人而异

优点

+ 古典催眠

+ CV演出优秀,多角色演出

+ 录音和后期制作精良

+ 原创台本

缺点

– 催眠+DIY稍许不兼容

– 复数音效还可以更好,音量增益(dB)稍小


作品信息

时长: 44:40

CV:咪啪
台本:夜城moon
后期:夜城moon

推荐度

■■■■■■■■ □□  8分

B站试听页面:https://www.bilibili.com/video/BV1Jv411p7v8/

爱发电页面:https://afdian.net/group/cfabe204c8bf11ebb68552540025c377

合欢教番外:宫玉娘与玉阳子

本次带来的是小哥哥工作室(前阿木木工作室重组)的中国特惠系列作品 《合欢教之宫玉娘与玉阳子》的中文同人音声(R18)评测。

本作品是男性向(CV是女,给男性听的意思)作品,声优是狐姬。音频是同人作品,声优的音色是少女音。音频制作是单声道。


结构

由于是同人音声,所以音声结构以故事为主。主题不多赘述是“合欢教”,绝大部分剧情是单元剧,剧情前后关联不大,套路依旧——即武侠小说里的合欢教妖女扮猪吃老虎的故事。

【以下文字有剧透】

故事开篇,一个年轻村妇【宫玉娘】(CV 狐姬)在山间大喊“救命”,有计划的偶遇男主【玉阳子】(听者),声称自己和兄长走散,不小心崴了脚【又双叒】,恳求上清观玉阳子师兄背自己回家……

玩法

开篇是常见的合欢教入门演技,尽管男主怀疑女主妖女身份【刚开始勇者都是很谨慎的】,故意装成弱者让师兄放松警惕,楚楚可怜,声泪俱下。男主宅心仁厚,亲自涂抹金疮药,背女主回家。话不多说,到家之后,女主三连:【烧水留宿、孤男寡女、昏睡红茶】,男主谨慎小心,处处提防,但没想到还是中了毒。

见状,女主自报家门——合欢教堂主宫玉娘。男主诧异万分,自己小心谨慎,但此时竟然无法使用真气,原来女主用檀木下毒,而刚刚的红茶其实是解药。男主依然负隅顽抗,不敌被调戏。【胸部Play】【言语调戏】

交锋一轮过后,玉娘终于开始了真人PK【娇喘Play】,半推半就男主吞下合欢教毒药,【正常Play】,男主绝顶。被药物控制后,第二轮PK,男主不得不泄露下山目的。玉娘见目的达成,约定每逢月圆之夜,男主向玉娘用情况交换临时解药。【笑傲江湖】

故事最后,某个月圆之夜,二人相会,约定合欢教一统江湖之后,二人携手隐居,于是二人满怀期待的再次PK…… 【合欢教还在统一武林的道路上坚持不懈,但总感觉武林正派越来越多了】


评价

+ 合欢教武侠的世界观

+ 时长高于平均


± 略S调教语言

± 有些玩法并不是适合所有人


– 单声道录制(低音质)

– 录制和剪辑都有瑕疵

– 剧情俗套


作品信息

CV:狐姬

总时长约 55:41

推荐度

■■■■■□□□□□ 5分

制作组QQ: 1207929062

双子催眠-妹妹的阴谋

本次带来的是中文免费催眠音声《双子催眠—妹妹的阴谋》(R15)的评测,关于催眠音声这一类型的介绍可以参考《中文音声现状》中催眠部分。

此作品是男性向(CV是女,给男性听的意思)作品。声优是CV咪啪。台本像一部日文作品,但也很有可能是完全原创。音频主要是现代催眠,声优的音色是温柔的少女音+御姐音。音频应该是单声道录制,后期混音立体声,有少量效果音。


结构

尽管是催眠音声,作品依然以一个情景剧的形式开篇。故事开始,男主(听者)计划和女友约会,早早地来到女朋友家。开门的是女友的妹妹(CV 咪啪),进屋后发现女友此时还没回来,于是两人便开始了闲聊。男主似乎很重视这次的约会,打算促进关系,进而有些紧张。考虑到女友妹妹能够助攻,于是男主接受妹妹的减压催眠……

【以下文字有剧透,强烈推荐听后再看】

开头是简单的导入,背景音的嗡鸣增加代入感,然后妹妹给予吸气、呼气提示音的同时,伴随着放松和暗示,“空白”和“放松”挂钩,让男主逐渐放下戒备。【音轨后期好评】而此处,台本设计了一个现代催眠的“诡计”,数字从大到小的变化,“声音的主动权”暗示让听者的时间感知变缓,而这种缓慢的过程,戒备感也逐渐减弱,慢慢进入浅层次的恍惚状态。当男主似乎忘却数字的时候,进入下一层催眠。【避免剧透】

加深的过程,随着”空白坠落”+”混乱感”的暗示,让听者自以为掉入了妹妹的“陷阱”,而这个自我欺骗的过程,会随着双子的呢喃,进一步加深催眠。听者因为双子错位效果,无法集中听清双子的每一句话,所以恍惚感加深。【暗示+环绕音】

玩法

开始应该还算做是催眠加深的环节,虽然男主被短暂的唤醒,似乎女友(CV 咪啪)回来了,并且询问男主今天约会的事。【此处其实有暗示】但耳边妹妹的话语依然不断暗示男主,进入到似乎一边在清醒、一边在恍惚的叠加状态。【双子正反暗示】听者需要抉择究竟听女友还是听妹妹,进而加深剧情代入感。随后,姐姐声音的慢慢淡出,而妹妹声音越来越清晰,这种错觉让听者被欺骗,于是加深妹妹催眠的主导力。

处于深度的催眠中,一个新的暗示被植入,伴随着这个暗示,另一个催眠“诡计”【唤醒+快速催眠】。在这个过程中,男主再次被唤醒,剧情中依然想和女友去约会,但似乎女友有些不满男主的昏睡状态。听者意识里,极力想挽回目前的状态,但似乎被妹妹的催眠控制,进而再次掉入催眠的陷阱中。【此处有反转和剧透】

这里的玩法,是一个现代催眠的反转。原本男主打算不断摆脱妹妹的催眠控制,竭力想回归清醒,并打算听清女友的每一句话,但女友这时话风一转,开始和妹妹一起调戏男主。因为是R15,所以只是暗示性语言,例如“木偶”,男主在女友姐妹的双子攻势下,终于“沉沦”在双子的海洋中…… 【这里其实呼应了之前的一个暗示】

唤醒部分,妹妹逐渐解除暗示,听者慢慢恢复状态。男主醒来后发现原来刚刚发生的只是催眠,是女友妹妹的角色扮演,可是真相究竟是……? 【开放结局】


评价

优点

+ 古典+现代催眠

+ CV演出优秀

+ 录音和后期制作精良

+ 台本优秀+作品有剧情反转

+ 中文催眠新人新作(附加分)

缺点

– 泛用铃声效果音有一点点出戏


作品信息

时长: 32:15

CV:咪啪
台本:细胞酱
修订:夜城moon,一直卖萌坏AC
后期:夜城moon
封面:细胞酱

推荐度

■■■■■■■■■■ 10分

B站发布页面:https://www.bilibili.com/video/BV1XK4y1K7Mz

M站发布页面:https://www.missevan.com/sound/player?id=3109705