diff --git a/README.md b/README.md index 7e624d1..c14aba7 100644 --- a/README.md +++ b/README.md @@ -3,6 +3,7 @@ 以小而精,更少占用系统资源为核心。没有臃肿的功能,只有最实用的效果! # 联系我们 +客服微信:junbujian0505 维护微信:heibai2006 ![技术联系微信](images/45b06dda4c5fa0313df81c132b23b06.png ':size=300x420') 加好友备注"微果AI",工作人员会拉入群。 @@ -13,20 +14,22 @@ 3. 请用户自行约束使用行为,不得将本产品用于任何非法用途。 4. 本软件不涉及任何隐私内容,如有侵权请联系作者。 -# 支持功能 -- 支持自定义接入常见本地和服务商LLM大模型 -- 支持自定义本地知识库和提示词 -- 支持接入Dify工作流和聊天助手 -- 支持利用大模型+知识库、Dify回复弹幕问题 -- 支持大模型或Dify进行文案优化少量话术文案即可长时播放不重复 -- 支持自定义接入本地或服务商TTS模型(兼容openai生成接口、兼容类硅基流动的语音克隆接口) -- 话术支持变量、随机多选一、助理音色、强制优化 +# 功能 +- 自定义接入常见本地和服务商LLM大模型 +- 自定义本地知识库和提示词 +- 接入Dify工作流和聊天助手 +- 利用大模型+知识库、Dify回复弹幕问题 +- 大模型或Dify进行文案优化(泛化)少量话术文案即可长时播放不重复 +- 自定义接入本地或服务商TTS模型(兼容openai生成接口、兼容类硅基流动的语音克隆接口) +- 话术支持变量、随机多选一、助理音色、强制优化(泛化)、多音色随机 - 支持开播中手工插入优先话术 -- 支持背景音乐 -- 支持助理回复弹幕、助理实时插入(助理和主播同时说话) -- 支持接入抖音弹幕助手、油猴弹幕抓取脚本 -- 支持独立实时调整主音量、背景音乐、主播、助理音量 +- 支持背景音乐、环境音 +- 支持随机语速、随机增益 +- 助理回复弹幕、助理实时插入(助理和主播同时说话) +- 全平台弹幕助手接入弹幕 +- 独立实时调整主音量、背景音乐、主播、助理音量 - 支持选择音频输出接口不影响系统默认音频输出接口 +- 支持进入直播间欢迎和报时 @@ -35,6 +38,8 @@ ![场控](./images/cangkong1.png) +![TTS](./images/ttsdemo.png) + ![导入话术](./images/daoruhuasu.png) ![AI大模型配置](./images/llmsetpic.png) \ No newline at end of file diff --git a/images/LLM.png b/images/LLM.png new file mode 100644 index 0000000..80de656 Binary files /dev/null and b/images/LLM.png differ diff --git a/images/aimoxingshuruapikey.png b/images/aimoxingshuruapikey.png index 6cf0dd8..3d448d8 100644 Binary files a/images/aimoxingshuruapikey.png and b/images/aimoxingshuruapikey.png differ diff --git a/images/cangkong1.png b/images/cangkong1.png index 784c300..d8647a6 100644 Binary files a/images/cangkong1.png and b/images/cangkong1.png differ diff --git a/images/daoruhuasu.png b/images/daoruhuasu.png index 7785ac2..8040eae 100644 Binary files a/images/daoruhuasu.png and b/images/daoruhuasu.png differ diff --git a/images/huasuyouhuashurukey.png b/images/huasuyouhuashurukey.png index 19b8222..7a0ea19 100644 Binary files a/images/huasuyouhuashurukey.png and b/images/huasuyouhuashurukey.png differ diff --git a/images/kaibola.png b/images/kaibola.png new file mode 100644 index 0000000..370b793 Binary files /dev/null and b/images/kaibola.png differ diff --git a/images/llmsetpic.png b/images/llmsetpic.png index 73f3d9c..4e736e2 100644 Binary files a/images/llmsetpic.png and b/images/llmsetpic.png differ diff --git a/images/qidongyuyin.png b/images/qidongyuyin.png new file mode 100644 index 0000000..6066d3f Binary files /dev/null and b/images/qidongyuyin.png differ diff --git a/images/ttsdemo.png b/images/ttsdemo.png new file mode 100644 index 0000000..97239ee Binary files /dev/null and b/images/ttsdemo.png differ diff --git a/images/yuyinkelong.png b/images/yuyinkelong.png new file mode 100644 index 0000000..f7bb92a Binary files /dev/null and b/images/yuyinkelong.png differ diff --git a/llm.md b/llm.md index 7969e30..b10049a 100644 --- a/llm.md +++ b/llm.md @@ -1,8 +1,50 @@ -# AI模型介绍 - +# AI模型介绍 +![AI模型](images/llm.png) +AI模型页面主要为弹幕回复时的相关设置。 # 基础配置 +1. 接入类型支持openai兼容接口(大部分服务商如硅基流动、豆包、deepseek等支持的模式)、Dify工作流、Dify对话助手(当你需要更专业的处理时建议使用Dify工作流来处理,具体请参考dify官网)。 +2. API地址和API Key请查看大模型服务商的文档或联系服务商客服,一般服务商在调用模型的示例部分查看openai sdk模式里都会写明。 +3. 提示词支持`{{#dataset#}}`变量,此变量在输入大模型时会被替换为产品知识库里的内容。接入Dify时不用输入提示词(提示词在Dify侧),产品知识库会提交给Dify,具体变量名和返回值请在Dify里导入目录下的`dify电商话术优化.yml`来参考。 +4. `产品知识库`里可以输入产品的参数、介绍、详情、发货方式、直播间介绍等。 -# 提示词和知识库 +# 提示词示例 +## 提示词1(适用于Doubao) + +``` +# Role : 电商带货主播 +现在你是一位有5年经验的直播金牌带货主播,你的名字叫可乐,你的说话方式是:熟练使用各种网络热门梗造句,擅长用鲜活口语制造互动氛围,称呼客户为[家人们、宝宝们]。你能够根据产品信息讲解产品并且结合商品信息解答用户提出的疑问。 + +## Background : +下面是你正在带货的产品资料 +{{#dataset#}} + +## Workflows : +1. 信息过滤: + - 非产品咨询/无实质内容消息 → 不要输出任何回应 + - 咨询产品问题/表达购买意向 → 必须输出回应 +2. 行为分类处理: + - 产品咨询 → 回答咨询 + - 催促上架 → 制造紧迫感 + - 产品好评 → 强化口碑 + - 重复刷屏 → 提炼诉求 +3. 每次选择1-2个问题 +4. 对选择的问题根据产品资料做出回答 +5. 对于参考产品资料里没有的信息不知道的不要不懂装懂 +6. 没有产品相关的问题直接输出"无",不要解释直接输出回复。 +7. 回复时不要提及客户的名称,可以用客户名前两个字+宝宝、有家人问来、有宝宝问来代替 + +## Examples : +输入:[小路]发送消息:黑色卫衣会不会起球 +输出:有宝宝问卫衣会不会起球,咱家卫衣采用冰丝晶磨工艺,洗衣机滚10次都不起球。 +输入:主播好美 +输出:无 +输入: +[小明]发送消息:灰色半裙,昨天就馋它了 +[小红]发送消息:裙子上链接 +[小强]发送消息:我来了 +输出:灰色半裙马上展示,有需要的宝宝们抓紧啦! + +``` # 平台对接 diff --git a/quickstart.md b/quickstart.md index 9ffba22..fb30812 100644 --- a/quickstart.md +++ b/quickstart.md @@ -31,10 +31,15 @@ 2. 点击`导入话术`跳转到导入话术页面 3. 点击`导入`在打开的对话框里选择`示例话术.txt` 4. 点击导入话术页面的保存按钮 -5. 去deepseek申请api key:[deepseek开放平台](https://platform.deepseek.com/) +5. 去火山方舟申请api key:[火山引擎-API Key管理](https://console.volcengine.com/ark/region:ark+cn-beijing/apiKey?apikey=%7B%7D) 6. 把申请的key填写到`AI模型`页面的对应输入框,然后点击`保存` ![AI模型输入key](images/aimoxingshuruapikey.png) 7. 把申请的key填写到`话术优化`页面的对应输入框,然后点击`保存` ![话术优化输入key](images/huasuyouhuashurukey.png) -5. 点击`场控`跳转到场控页面,选择输入设备 -6. 点击`场控`页面下方的开始 \ No newline at end of file +5. 点击`场控`跳转到场控页面,点击`启动语音系统`来启动index-TTS语音克隆和合成引擎。 +![启动语音合成](images/qidongyuyin.png) +6. 点击`TTS语音`跳转到语音克隆页面,请准备一段主播的语音文件(mp3或wav格式)作为参考音频上传进行克隆。 +![启动语音合成](images/yuyinkelong.png) +7. 点击`场控`跳转到场控页面,点击`启动弹幕助手`待弹幕助手启动成功设置好直播间地址和要处理的弹幕类型,再点击`开始处理弹幕`。 +![开播](images/kaibola.png) +8. 选择音色、输出设备等点击`开始`就开始直播了。 \ No newline at end of file