chatgpt有多少个模型? 有什么分别?
不同的模型
其实 OpenAI 不只有泛化的 GPT-3 模型,还有针对特定任务的模型,比如 Codex 专注代码生成,和 Content filter 专注内容是否安全(敏感信息或者不良信息),我们暂时只讨论 GPT-3 模型。
不同的模型(来自文档,我们后面会测试):
- 达芬奇(Davinci)
最强大的 GPT-3,也是最贵的,可以做其他模型做的一切事情。一般质量更高,结果更长,更遵守指示。
对于需要对内容有很多理解的应用,例如针对特定受众的摘要和创意内容生成,达芬奇将产生最佳结果。这些增强的功能需要更多的计算资源,因此每个 API 调用的成本更高,并且速度不如其他模型。
达芬奇在理解文本意图方面也是一大亮点。达芬奇非常擅长解决许多种逻辑问题并解释字符的动机。达芬奇已经能够解决一些涉及因果关系的最具挑战性的 AI 问题。
擅长于:复杂意图、因果关系、针对受众的摘要 - 居里(Curie)
非常强大,但速度非常快。尽管在分析复杂文本方面达芬奇更强大,但居里非常擅长许多微妙的任务,如情感分类和摘要。居里在回答问题和执行问答以及作为普通服务聊天机器人方面也非常擅长。
擅长于:语言翻译、复杂分类、文本情感、摘要 - 巴贝奇(Babbage)
可以执行简单分类等简单任务。当涉及语义搜索(Semantic Search)对文档与搜索查询的匹配程度进行排名时,它也非常有能力。
擅长于:中等分类、语义搜索分类 - 艾达(Ada)
通常是最快的模型,可以执行解析文本、地址校正和某些不需要太多细微差别的分类任务。提供更多上下文信息可以提高艾达的性能。
擅长于:解析文本、简单分类、地址校正、关键字
简单的结论是,因为 GPT-3 可以做很多任务,我们一个复杂的系统也需要很多能力,但是都用一个模型,最好的模型,比如 Davinci 的话,可能太贵。如果 Ada 或者其他低级模型可以做的事情,尽量不用 Davinci ,可以省钱,还可以让系统变得更快。
现在,openai已经出了 gpt-3.5-turbo 模型,价格0.002U/k -tokens ,速度快价格低,请务必切换到此模型。
gpt-3.5-turbo
主机差评君首发于zhuji188.com,转发请标明来源https://zhuji188.com/1067.html
THE END
二维码
共有 0 条评论