ChatGPT大大大升级,这回谁要慌了?
作者|James
Hello各位打工人!现在相信有一个问题非常困扰大家:
今天到底星期几?
踏入连休之后的7天班,不论是早上被设定的好多个闹钟群殴,还是假装在电脑前聚精会神,心思却跑到了九霄云外。
上面这些由藤子·不二雄、鸟山明等日本泰斗级漫画家带来的画作,肯定都能充分描绘你的现状吧。
——哦,有一点我说错了,上面这几幅画并不是由那些漫画家本人画出来的。创作它们的是内置了DALL-E 3的ChatGPT Plus。
虽然不是为了给祖国母亲生日献礼,但OpenAI确实是在刚刚过去的长假里面,对Plus用户灰度开放了下列新功能:
用必应搜索的能力,此前因效果不佳临时下线,此番重新恢复;
默认模式允许上传图片,并且识别图片内容;
加入了DALL-E 3文生图模式。
其中,DALL-E 3还没有普及到所有ChatGPT Plus订户中,不过娱乐资本论·视智未来手中的账号已经是开通了上述所有能力的“完全体”了。
有的Plus用户虽然续了费,但是并不能见到上面所有这些功能。此时,阅读我们下面这篇简单的介绍和上手指南就非常重要了。
可以说,这里面每一个能力都是这大半年以来ChatGPT的用户们期待已久的。但是它们实际上的效果如何,是否可以真正融入我们的日常工作流当中,又会不会对市场上的竞品构成重大的威胁呢?
娱乐资本论·视智未来一向是各位文娱、内容产业读者的贴心小伙伴,不论是科普。评测还是培训,我们始终坚持一个原则:就像在实际的生产过程一样来测试和使用AI工具,而不是单纯追求让它“炫技”。
是骡子是马,我们现在就拉出来遛遛。
VOL.1
必应搜索在进入大家都很关心的图像能力之前,先来看下恢复上线的必应联网模块。
上个月,娱乐资本论·视智未来刚刚完成了第二轮文本大模型实用场景横评。读者们应该记得,在那次测试中,GPT-4不联网时的表现依然稳定,然而当它使用VoxScript等插件联网时,效果却比一些国产大模型的表现还要差。
我们也分析了相关的原因,主要是官方与必应合作的联网插件不能使用时,其他第三方插件的表现不稳定,而且参差不齐。
这次官方联网的回归,让我们期望它会有比以前更好的表现,但实际上并没有好太多,很难称得上提供了全面和准确的答案。
而且,与使用插件联网不同,这里不再允许你查看它在回答问题时具体访问了哪些网站。所以,结果不理想时也无法找出原因。
当然,GPT支持更长的提示词和答案生成,而必应只支持几百个字的短答案,但联网还会占用GPT-4每3个小时50次的限额。所以有时你在必应官网用AI搜索,效果可能更好一些。
所以就是这样,让我们赶紧进入下面的重头戏。
VOL.2
DALL-E 3绘图现在我们可以回顾一下本文开头的三张图。
这三张图的最终效果都非常出色,可以说在这次更新之前,所有的文生图工具中,只有Midjourney能够达到这种水平。当然我们一直认为竞争对手达到MJ的高度是迟早的事情,但DALL-E 3的出现比我们想象的早得多。
当然,在ChatGPT中引入图片生成,最大的改进不仅在于生成的效果,还在于生成的过程。
我们知道与文字相比,无论是SD还是MJ的提示词,都更不能随便写,它们有更多规则、格式乃至“咒语”的要求,在生成图片时起到了重要作用。像我们的AIGC大师课中就指出,有些绘画风格、艺术家名称、效果光线等都需要指定,而这些词汇所酝酿出的结果就像炼丹一样。
在如今的ChatGPT里面,这些已经是过去的事情了。我们现在所使用的方法,会更接近要求一位人类画师去做事,说的话也更接近自然语言,GPT-4承担了转译的工作。
ChatGPT会根据用户的需求,一次提供四个不同的真·提示词,并将它们导入DALL-E中生成四张不同的图片。这比单一提示词生成四种变体更完善,还可以指定其中一张继续进行微调,尽管效果不一定如人意。
让我们来回顾文章开头的画作是怎样生成的。
首先,当我们看到一张梗图很有趣,于是想自己画一张的时候,这是非常常见的使用场景。
不过,在DALL-E 3之前,我们似乎难以想象除了Midjourney还有什么文生图工具可以出来比较好的效果。
点开可以发现,每一张图的prompt都各不相同。
尽管AI作图嵌字问题还是没完全解决,但你可以看出跟之前版本相比有了巨大的进步。此时我们甚至可以只用Windows自带的“画图”来给它加上适当的字体。
其它图片也类似:
很显然,如果我们想使用传统文生图方法,生成提示词是需要我们自己动脑的事情,但现在GPT已经承担了这个重任。当你点击具体的图片时,可以看到它使用了哪些提示词,并将其复制下来。在生成结果出现问题时,也可以通过分析提示词构成来发现问题所在,以及是否有可能改进。
由于成图的完成度非常高,图像裁切不需要的部分,以及往里面嵌字,甚至只需要使用Windows自带的画图就可以完成。
在下面的测试中,我们发现,如果你的指令非常简单,ChatGPT生成的作品或许有一些对东亚文化元素的刻板印象和挪用。例如:
请创作一幅中国庆祝三·八国际劳动妇女节的海报。主题是:“巾帼筑梦心向党,强国复兴勇担当”,但不需要在海报中出现文字。
接下来,我们尝试用必应搜索给我们总结,怎样优化提示词,让生成效果更贴近我们的需要。
尽管如此,如果你直接让ChatGPT改图,它依然大概率不会按照你的要求直接改动,这反映了DALL-E 3在识别prompt方面的局限。
如果你点开它更改过的prompt,就会发现不是提示词的问题,GPT实际上已经尽力了。所以,一次生成的图最好还是由人工在后期改动。
oil painting of a modern Shanghai ballerina, gracefully posing in front of iconic landmarks near the Bund. In the background, there's a plain red flag without any emblems, stars, or symbols, fluttering in the wind. The scene is dominated by red and gold hues, and a clear space at the bottom is reserved for potential text.
即使如此,我们也已经得到了几张最终效果很好的图片。
上述试用过程代表了一个总体趋势,即prompt微调的作用大大降低,我们文生图给AI下的指令将会越来越接近自然语言。
VOL.3GPT-4 识图另一个最受欢迎的ChatGPT新功能,当然就是识别图片的含义。
在一些近期的测试中,GPT-4是可以读出一些幽默或者寓言故事中的潜台词,分析画面当中人物的心理和情绪。当然,这些都是重大的突破,但总体来说还是属于“常规动作”。
我们想看看它还能不能做更好玩的事情--比如看X光片。
医学影像行业是不是要被替代掉了?实际结果远远没有这么乐观。
我给了GPT一张有问题的X光片(这里不放原图,因为那是我自己的X光片),人类医生可以看到一颗劈裂牙和右下颌骨的一块含牙囊肿,但GPT并没有识别出任何问题。
回头看一下上面那张网图,它的问题是一样的,它知道这是牙片,但除此之外就没有然后了,它倾向于对看不出来、不确定的东西报喜不报忧,这点倒是跟“百度一下,我觉得我快挂了”完全相反。
看来,影像科室里看片的人类,目前还可以继续高枕无忧。
在不这么严肃的问题上,比如翻译一个外文广告牌,是可以胜任的。你可以将这个结果跟Jina.AI的同款产品做个对比。
翻译确实是ChatGPT的长项,图片识别更是让这一长处如虎添翼。不过,它具体胜任到什么程度,又取决于它基础知识的积累,在不那么熟悉的领域,比如翻译维吾尔文,照样“一本正经地胡说八道”。
接下来的测试在效果上可谓非常惊艳。我们在一个设计师常用的网站Dribbble上找了一些网页和APP的效果图,然后让它直接生成一个在浏览器中真的能打开的网页代码。
它完成了这个任务--非常出色。
虽然没有完全复刻效果图,但如果我完全不会前端代码,又想从零开始做,那么它已经能让我做出一个可用的东西。甚至因为它的实现与效果图中细微的区别,还可以说它给原作“洗稿”了。这可能是运用GPT的发散思维能力的一个最佳案例。
经过4-5次提示词调整后,成品如下:
可以说,动嘴修改的成功率远高于之前预想,而且再怎么说,也比不断微调代码要简单多了。这样一来,各位文字工作者们可以用前所未有的简单方法,来试着搭建自己的作品集或个人网站。
VOL.4谁要慌了?回头再看一看我们所做过的这些测试:
不需要懂英文,就可以用自然语言让DALL-E 3作画,效果逼近Midjourney;
可以识图、在热门语言之间翻译图像内容;
将一个画出来的界面图转换为真正的网页,不会前端技术也可以设计自己的网站……
这些进化,给人最大的感受就是意料之外,情理之中。仔细一思考就会发现,这些功能只是对原本GPT-4基础能力的巧妙运用,将原本相互分离的不同模态结合在一起,就化腐朽为神奇了。
在识图和绘图时,GPT仍然会瞎编,因此仍然需要你的专业知识来补充那些它不掌握的领域,做事实核查,并决定如何剪裁和应用它的回答。
这进一步强化了我们对GPT的理解,它是一个为现有从业者提供的工具,可以增强你现有的能力,但不能自主产生知识,只能根据你的思路进行操作。
ChatGPT不会取代我们的大多数读者,但是会更好地帮助我们。但是,当然也会有人看到这些进步之后感受到真实的恐慌。
“
1
比如我们一直在对比的Midjourney本尊:对于普通用户,既然手头已经有一个效果上与MJ相差不多的工具。数量又几乎没有限制,还不用额外掏钱,那为什么还要再买MidJourney呢?这种搭配组合将用户更深度地绑定在OpenAI的体系内,也让GPT每月20美元的月费变得越来越物超所值。
“
2
比如各种国产大模型的开发者:作图精度,语义理解这些,目前ChatGPT都是几个最强的合在一起,让GPT与国产大模型之间的差距似乎成了更加难以逾越的天堑。但是,开源领域仍然可以继续追赶,类似于LLaMa的图片应用LLaVA也出现了。
“
3
比如第三方整合各家服务的开发者们,可能需要重新思考自己的开发方向。例如,趁着不是所有大模型都有多模态的空当,可以在第三方应用中被智能地调用最适合的模型,以执行相关任务。这样,用户将能够使用各个领域中的最优解,我们之前采访过的Jina就是正在做这样的工作。
我们期待第一方或者第三方服务,可以将现有分散在不同模态上的能力真正的组合起来,而不是说互相独立地放置。
ChatGPT的进步说明,Openai或MJ树立起来的壁垒并不是绝对无法攻破的,只是后来者需要花费几个月、半年或一年的时间差来赶超。对于后来者来说,坚持下去而不倒闭,可能就是胜利的关键。
挑战!最近ChatGPT很火,这个AI究竟有多强大呢?所以我们就来让它挑战一下,用《我的世界》小萌新最喜欢问的几个问题来测试。面对Minecraft经典的一些问题,ChatGPT又...
ChatGPT最近有多火,就不用多说了。自2022年11月上线至今,ChatGPT的活跃用户已经破亿。成为史上增长最快的消费级应用程序,甚至多次出现因访问量激增而宕机的情况。Cha...
近日,知名游戏大厂网易官宣。旗下开放世界武侠手游《逆水寒》将实装国内首个游戏版ChatGPT。据悉,这是ChatGPT首次用于游戏中。其不仅能够让智能NPC和玩家自由生成对话,并基...
一说到“套装装备”大家可能都很烦,但是不要慌,这一次是所有人都需要更换,而且这次更换算得上全民提升,不会影响现有装备搭配的,下面咱们来详细介绍一二!1、灵通贴膜→烈炎/大地贴膜国服...
游戏的意义就在于它能够给人带来快乐,大家好,我是小三,每天给大家分享游戏中的八卦趣事。恐慌卖货,恐慌跑路,做空梦幻的幕后黑手到底是谁?不知道大家有没有发现,现在梦幻西游中有一批人总...
拜托ChatGPT分析了树莓派破解Switch的代码,这些代码来自于github。它们是Picofly作者公开的那部分我觉得不用我来说原理了。ChatGPT把我要写的全部写完了 ...
ChatGPT这段时间火遍世界,知道的人都知道。不知道的人还是不知道,好像是说了一句废话,不过没关系,逸鸽子就带着大家来看一看当原神遇上ChatGPT后会产生怎样奇妙的化学反应。观...
在游戏开发的世界里,创意和效率是王道。而现在,有了ChatGPT这个强大的人工智能工具。游戏开发者们找到了一个全新的助手,它不仅能激发创意,还能极大提高开发效率。首先,让我们了解一...
游戏预告:《ALZARARadiantEchoes》上线Steam页面今日(5月15日),3D回合制RPG游戏《ALZARARadiantEchoes》的Steam页面正式上线。该...
最近,著名游戏《不朽者传奇》的开发商Ascendant工作室发布了一则令人振奋的消息。他们宣布,在未来,这款游戏的所有销售收入都将直接归工作室所有,而不再由发行商EA获得任何收入。...
大航海时代4HD—游戏中哪个角色的故事让你印象最为深刻作者:单机游戏小虾米《大航海时代4》是光荣公司于1999年推出的一款冒险RPG,在这个游戏中。除了7名主角之外,还有近百名各具...
各位老铁,天龙江湖如今会玩的老玩家是真的多。别的不说,就连各路大佬们也是开始玩白嫖了——今天给大家介绍的是来自【三生三世】服务器的绝情谷选手。开局先上一个满三的重楼肩,剩下的表示自...
在原神游戏中,吸引玩家的。不仅仅是好玩刺激的游戏体验,也有来自叙事故事带来的种种情绪和玩家对人物故事的探索,我们时常会被一些未解的谜团所吸引。其中,派蒙的身份及其能力无疑是众多玩家...
在市面上众多的的传奇手游中,传奇3D纯净版手游也是凭借其独特的魅力,成功吸引了无数传奇玩家的目光。这款3D传奇手游不仅继承了传奇的经典玩法,更在打造纯净游戏环境上下了功夫。让玩家能...
#地下城与勇士#国服新一轮职业平衡终于公布了,其中剑豪做为此次策划亲自加强的职业。居然仅仅加强了7%。相比之下,当前版本热门的职业剑影居然也加强了。策划真是不玩游戏啊,就加强这么一...
西游笔绘西行是一款充满奇幻魅力的战斗冒险手游,以后西游为题材,巧妙融入国漫元素,将玩家带入一个绚丽多姿的西游世界。作为一款回合制策略手游,西游笔绘西行不仅考验玩家的策略布局能力,更...
直播吧05月16日讯今日的MSI胜者组决赛上,GEN在第一局失利的情况下。最终战胜对手BLG晋级决赛。而此前此前在本届MSI正赛阶段中的十场BO5,首局取胜的队伍均最终获胜,GEN...
全民无人直播是指不需要主播参与,通过自动化技术实现的直播形式。这种直播方式可以节省人力成本,但是否能够赚钱取决于多个因素:1. 观众数量:直播平台通常通过广告、打赏、付费订阅等方式...
小编推荐