国产AI造成困惑的原因
背景
以chatgpt为代表的大语言模型自问世以来就被广泛用于知识学习和科学研究中,本来国产大模型与gpt的差距非常明显,基本没人肯去使用, 但是从去年开始deepseek、通义千问和豆包都有了明显进步,再加上从中国大陆无法直接使用国际一线大模型,于是国产大模型突然爆火。尤其是从2023年开始的AI元年浪潮被中国大陆的普通用户完全错过了, 于是2025年以来所表现出的报复式增长尤为明显,随之而来的质疑和抱怨也不断产生,其实这些问题早在2023年就开始被美国社会所重视,只是中国大陆延后了两年才集中爆发而已。
近期听闻的几种抱怨
对于AI使用经验比较丰富的人来说,这些问题都已经屡见不鲜了,并且也都有对应的策略来压制其幻觉,但是国内从去年才高频率接触大模型的人可能会感到困惑。
前段时间正好是高校毕业论文集中提交和审查的时间,在现实中和网络论坛里都能看到不少人抱怨说“用豆包写的论文太垃圾了,根本没法用”,还有不少人都说“deepseek写的东西不专业,太科普了”。 其实这些问题产生的原因正好是国产大模型的先天缺陷和后天局限。
国产大模型的先天缺陷
正如之前已经谈到过的内容,国产大模型有先天缺陷,那就是给它训练的语料中缺少很多不符合法律和政策的内容。假设大模型是一个真实的人类,那么在它从小到大的成长过程中, 既能看到真善美,也能见到假恶丑,无论是正义的还是负面的语料都是构成这个人的思维的必不可少的一部分。 对于AI来说,我们的训练目标必然是让它主要输出正确的价值观,尽量不输出违法违规内容,但是这并不意味着在模型的训练环节它就一点邪恶的信息都不能摄入。一个只见过真善美而没见过假恶丑的人类一定是思想缺陷的, 同理,如果大模型也没接触过负面和违法的语料, 那么它的思维能力也一定是脆弱和残缺的。我们可以不让他输出不合规的内容,但是绝对不能不让他了解这些信息。
所以,在训练阶段没有学习过违禁内容是国产大模型的先天缺陷。
国产大模型的后天局限
这个后天局限主要表现在RAG阶段,也就是检索增强生成的环节上。
这里有必要简单解释一下什么是RAG。RAG就是在大模型正式回答用户问题之前,先由系统根据问题的关键词进行一番搜索,然后把搜到的内容作为附加材料一并提问,这样可以弥补大模型自身知识库的遗漏。 这个技术的主要应用就是AI搜索,由AI决定用什么关键字搜索,然后再把搜索到的结果总结出来,顺便把用户的问题结合搜索结果进行解答。
从2024年的gpt-4o开始正式普及了AI搜索,做的比较好的有perplexity,国产对标产品是Kimi AI和秘塔AI搜索,虽然这三个分别是国外和国内做的最好的,但是仍然受限于大模型本身的能力和搜索引擎的质量,实际的使用体验并不理想。 而拥有最强传统搜索引擎的谷歌在这个方面反而一塌糊涂,openai虽然基模最强,但是它所使用的必应搜索给它拖了后腿。总之,综合起来其实chatgpt的联网搜索的使用体验是最好的, 但我设想中的最佳RAG体验应该是gpt作为基模调用谷歌搜索接口,当然,这个组合几乎不可能存在。
然而增加了RAG的国产大模型,本身基础模型就有先天缺陷,它们所使用的搜索引擎更是受到诸多限制,各种敏感词全都不能搜索,而且国产的搜索引擎即使不考虑广告的干扰,本身也搜不出什么有价值内容,两者结合起来就导致了RAG的质量雪上加霜。
因此,屏蔽敏感词和搜索引擎不给力两个因素共同导致了国产大模型在RAG方面存在极大的后天局限性。
小结:先天负面语料缺陷+后天搜索引擎局限
现在就可以得出一个十分尴尬的结论,国产的大模型虽然看起来非常热闹,月活用户屡创新高,但基本都是赔钱赚吆喝,尤其是在生产力工具领域根本不具备实用价值,只能作为一个娱乐工具来玩一下。
针对抱怨的解释
现在就很容易理解为什么会出现这种抱怨了,首先,国产大模型不开联网功能压根输出不了多少高价值内容,比如学术写作;其次,开了联网功能以后,它对学术搜索的内容会直接以中文进行检索,搜到的内容比英文搜索的结果质量低了好几个档次, 另外,由于国产搜索引擎本身的不给力,即使是搜索纯客观的学术信息,也会优先搜到一些自媒体科普文章或者公众号新闻,比如某某大学发表了一篇什么论文,论文的内容确实是你想搜索的,但那里面写的都是很科普的非专业语言, 基于这些内容进行RAG输出的文字必然质量很差。
这里面最坑爹的就是国产大模型一旦开始联网搜索,它就把公众号和二手转载信息的权重调的很高,生怕你能看到第一手资料。这个原因就是它们还缺乏对学术搜索的优化,不能自动优先搜索英文内容,以及原本就是针对普通人自娱自乐开发的产品, 自然是优先搜索科普的通俗易懂的文章内容,所以对于下沉市场的低端人口来说,这种设计反而是比较讨巧的。但是,当它们把低端人口作为用户增长点的时候,就注定了不可能成为学术用户的生产力工具。
这就是国产大模型的局限和悲哀。
重要备注
必须补充的是这并不意味着国际一线AI做的多么完美,它们确实比国产的好很多,但也绝对不是可以闭着眼采用的,尤其是没有按照正确的方法使用还可能被降智。
总结
国产大模型因为训练语料被阉割,搜索引擎屏蔽敏感词,优先呈现非专业内容,重点以下沉市场的增量作为产品目标,共同导致了难以满足学术使用的需求,不能作为生产力工具来使用,从而出现了开头所写的被人抱怨和诟病等现象。 针对这个问题的唯一解决方法就是不用国产AI或者彻底不用AI完全手写。
后记
正确使用ChatGPT完整功能的简单介绍
既然国产AI没法满足生产力工具的需要,那么如何使用目前最好的大语言模型呢?篇幅有限,下面只能写出最核心的关键步骤,具体细节以后再说,或者自行搜索。
以ChatGPT为例,首先想用上真正完整功能的版本,需要满足以下几个条件:
- 稳定的境外网络环境。这里主要是需要稳定,对于出站(落地)IP是机房还是家宽没有要求,对速度和延迟的要求也不高,因为AI传输的流量很少。
- 启用WARP。ChatGPT网站的防火墙和CDN都由Cloudflare负责,它本身就很容易对它认为可疑的IP地址进行降智,一旦降智了那就跟弱智一样了。所以,解决办法就是伪装成自己人,使用WARP即可。 WARP是cloudflare自家的VPN,使用以后就可以用它自己的IP访问。但是这个WARP必须在境外VPS上运行才行,如果在中国境内运行的话,得到的IP是一个能自由访问互联网的归属地为中国大陆的IP,正好处于ChatGPT拒绝服务的范围内。
- 开通会员,至少是Plus级别,但是Pro的意义不大。
开通会员的最简单支付方法
- 千万别用虚拟信用卡和加密货币,这些都是电信诈骗和洗钱的工具,特别容易触发风控,轻则冻结账号,重则人财两空。
- 用支付宝购买礼品卡给美区苹果账号充值,然后在苹果商店购买会员并支付;也可以用Google Play绑定银行卡完成类似操作。
- 在选择套餐的界面把地区切到欧盟成员国,然后就可以用中国区的PayPal账号通过中国信用卡来直接购买了,只不过价格会比20美元略贵一点,但是最大的好处是合法合规,自动续费,省时省力。
以上就是能确保ChatGPT不降智的主要方法,缺一不可。