清华开源模型ChatGLM-6B
AI大模型
2024-10-15 16:10
一个由清华大学技术成果转化的公司智谱AI 开源的中英双语对话语言模型。它基于 General Language Model (GLM) 架构构建,拥有62亿参数,支持在消费级显卡上进行本地部署
产品参数:
收费方式
免费
产品语言
简体中文
开发公司
应用平台
PC,
产品介绍:
产品简介
ChatGLM-6B:开源双语对话语言模型。
架构:基于General Language Model (GLM)。
优化:针对中文问答和对话进行优化。
功能及特色
中英双语支持:在1:1比例的中英语料上训练,兼具双语能力。
模型架构优化:吸取GLM-130B训练经验,使用传统FFN结构。
低部署门槛:最低只需6GB显存即可在消费级显卡上部署。
长序列处理:支持长达2048的序列长度,适用于长对话。
人类意图对齐:通过多种训练方式,使模型理解人类指令意图。
使用方法
模型下载:从Github上下载模型。
本地部署:利用模型量化技术在本地显卡上部署。
对话生成:输入文本,模型将生成符合人类偏好的回答。
应用案例
客户服务:作为客户服务中的自动回复系统。
语言学习:辅助中英文学习者进行语言练习。
内容创作:帮助内容创作者生成创意文本。
局限性
事实性错误:可能在事实性知识任务中生成不正确的信息。
有害内容:可能会产生有害或有偏见的内容。
上下文理解:在长对话中可能丢失上下文或产生理解错误。
社区贡献
官方网站
ChatGLM-6B GitHub:https://github.com/THUDM/ChatGLM-6B