您尚未登录。

楼主 # 2026-03-31 14:18:46

double33
会员
注册时间: 2021-11-30
已发帖子: 36
积分: 46

记录分享在RK1820协处理器上探索语音交互

一个完全不懂LLM的哞哞,硬着头皮搞AI语音交互的探索之路

一、跑demo:
Qwen2.5最多只能跑3B,再大的话内存不够加载不起来,首词响应时间(TTFT):87.316 ms;生成速度:94.14 Tokens/s。
Qwen3 1.7B可以,4B跑不起来。
实际跑起来回答速度还是非常快的。

谈谈功耗:
1、只加载,不推理功耗大概有4W多。

2、推理时,有12W多,不过NPU好像还没满负荷,所以实际还可能更高。

....更新待续

离线

页脚

工信部备案:粤ICP备20025096号 Powered by FluxBB

感谢为中文互联网持续输出优质内容的各位老铁们。 QQ: 516333132, 微信(wechat): whycan_cn (哇酷网/挖坑网/填坑网) service@whycan.cn


东莞哇酷科技有限公司开发