我们生活在一个实用AI的时代,但许多人还没有真正体验到它,或者即使体验过,他们也可能会纳闷这有什么了不起。因此,有了这篇指南。这是我今年早些时候为学生们写的一个修改过的版本,但很多东西已经发生了变化。这是一个关于如何让AI做实际事情的概述。
为什么人们一直忽略AI能做什么。 像ChatGPT这样的大型语言模型非常强大,但是它们的构建方式让人们往往以错误的方式使用它们。当我与尝试过ChatGPT但没觉得有用的人交谈时,我倾向于听到类似的故事。
首先,人们尝试用AI做它最差的事情,就像使用Google一样:告诉我关于我的公司,查找我的名字等等。这些答案很糟糕。许多模型并未连接到互联网,即使是那些连接到互联网的模型也会编造事实。AI不是Google。所以人们失望离开。
其次,他们可能尝试一些猜测性的事情,像使用Alexa一样,提出一个问题,通常是关于AI本身的问题。AI会抢走我的工作吗?你喜欢吃什么?这些答案也很糟糕。除了一个例外,大多数AI系统没有个性,没有像Alexa那样编程成有趣的,也不是未来的神谕。所以人们失望离开。
如果人们仍然坚持下去,他们开始提出更有趣的问题,无论是出于好奇还是基于他们半记忆的大学论文题目:写一篇关于为什么鸭子是最好的鸟的文章。为什么《麦田里的守望者》是一本好小说?这些问题要好得多。因此,人们看到了他们并不是非常关心的话题上的一大段文字,这样还可以。或者他们在他们擅长的领域看到了文字,并发现了差距。但它不是那么有用,也没有写得非常好。他们通常在这个时候放弃,确信每个人都会用这个来在学校作弊,但没有什么别的。
所有这些用途都不是AI实际擅长的,也不是它能提供帮助的方式。它们可能让你忽略了这些工具的真正力量。我想尝试向你展示一些为什么AI如此强大的原因,无论是令人兴奋还是令人焦虑的方面。
六大语言模型
首先,让我们介绍目前可用的六大语言模型,价格在免费到每月20美元之间。
前四个(包括Bing)都是OpenAI系统。基本上现在有两个主要的OpenAI AI:3.5和4。3.5模型在11月引发了当前的AI狂热,4模型刚刚亮相,功能更强大。一个新的变种使用插件连接到互联网和其他应用程序,但它仅处于早期测试阶段。如果你从未付费使用过OpenAI,你只使用过3.5。除了插件版本,这些模型都没有连接到互联网。
微软的Bing使用4和3.5的混合。它连接到互联网。Bing有点奇怪,但很强大。这是我关于如何使用它的指南。此外,谷歌发布了一个令人失望的AI叫做Bard(尽管他们可能很快向我们展示更令人印象深刻的模型),Anthropic发布了Claude,尽管它更专注于商业用户。那么,你可以用这些东西做什么呢?
AI 应用概述:
写作
开源选项:暂无(敬请关注) 最佳免费选择:Bing 和 ChatGPT 3.5 付费选择:ChatGPT 4.0/ChatGPT 带插件
目前没有其他通用AI工具能与GPT-4匹敌,你可以通过Bing免费访问,或通过购买每月20美元的ChatGPT订阅来使用。GPT-3.5在写作方面也很出色,速度更快。我在使用AI来辅助写作方面做了很多尝试,以下是你可能觉得有用的方法列表:
写作任何东西。博客文章、论文、宣传材料、演讲、讲座、选择性冒险、剧本、短篇小说 - 无论是什么,它都能完成。但是,你不能只给它基本提示。基本提示会导致乏味的写作。从ChatGPT中获得优秀写作需要一些实践,这里有一个指南。ChatGPT-4在写作方面要好得多。Bing在写作方面非常出色,但需要一些说服力。
改进你的写作。将你的文本粘贴到ChatGPT中。要求它改进内容,或者针对特定受众提出如何改进的建议。要求它用截然不同的风格创建10个草稿。要求它让事物更生动,或增加实例。(尽管注意它只“记住”几千个单词的文本)
帮助你完成任务。AI可以撰写电子邮件、创建销售模板、为你提供业务计划的下一步,等等。这里有一个关于我在30分钟内可以用它完成的事情的例子。
解除阻碍。很容易因为一个困难的挑战而分散注意力。AI为你提供了一种保持势头的方法。
需要注意的事情:为了回应你的答案,AI非常容易“产生幻觉”并生成看似合理的事实。它可以生成完全错误的内容,而这些内容却令人信服。让我强调一下:AI会不断地撒谎,而且撒得很好。它告诉你的每一个事实或信息都可能是错误的。你需要检查所有内容。特别是在询问数学、参考文献、引用、引文和互联网信息时(对于未连接到互联网的模型),Bing和ChatGPT-4在这方面做得更好。这里有一个关于避免产生幻觉的指南。
AI也无法解释自己,它只是让你觉得它在解释。如果你要求它解释为什么写了某些东西,它会给你一个似是而非的答案,而这个答案完全是编造的。它并没有审视自己的行为,它只是生成看起来像在这样做的文本。这使得理解系统中的偏见变得非常具有挑战性,尽管这些偏见几乎肯定存在。
它还可能被不道德地用于操纵或欺骗。你要对这些工具的输出负责。
制作图像
开源选项:下载 Stable Diffusion 需要注册的最佳免费选择:Bing 或 Bing Image Creator(使用 DALL-E)、Playground(允许使用多个模型) 最佳选择:Midjourney
目前有三个大型图像生成器:
Stable Diffusion,它是开源的,您可以从任何高端计算机运行。开始需要花费一些精力,因为您必须学会正确制作提示,但一旦掌握,它可以产生出色的结果。它尤其擅长将AI与其他来源的图像相结合。如果您选择这条路,请务必阅读这个关于Stable Diffusion的指南(确保阅读第1部分和第2部分)。
来自OpenAI的DALL-E,已整合到Bing(您需要使用创意模式)和Bing图像创建器中。这个系统非常好,但现在还不如…
Midjourney,这是2023年初最好的系统。我建议使用MidJourney的原因是它具有最低的学习曲线:只需输入 “thing-you-want-to-see –v 5”(–v 5 结尾很重要,它使用最新模型),您就能获得很好的结果。Midjourney 需要 Discord。这里有一个关于如何使用 Discord 的指南。
一些用途:
为演示文稿或报告添加插图 为您的产品制作库存照片 创建设计模型 创建应用程序或网站的模型 创建徽标 娱乐 需要注意的事情:这些系统是围绕具有内置偏见的模型构建的,因为它们在互联网数据上进行了训练(例如,如果你要求它创建一张企业家的照片,你可能会看到更多以男性为主的图片,除非你指定“女性企业家”),您可以使用此浏览器查看这些偏见。
这些系统还以不透明且在法律和道德上可能存在问题的方式接受互联网上现有艺术的培训。尽管从技术上讲,您拥有所创建图像的版权,但法律规定仍然模糊。
此外,目前它们不会创建文本,只会创建一堆看起来像文本的东西。但是它们在手部制作方面越来越好。
提出想法 开源选项:没有很好的 最佳免费选择:Bing 和 ChatGPT 3.5 付费选项:ChatGPT 4.0 / ChatGPT 带插件
尽管(或者实际上,正因为如此)所有的约束和奇怪之处,AI非常适合创意发想。你通常需要很多想法才能有好的想法。并非每个人都擅长产生大量的想法,但AI在产生数量方面非常出色。这些想法都会是好的或者理智的吗?当然不是。但是它们可以激发您进一步的思考。
怎么做呢?只需要求提供想法,它就会提供。但还有更高级的技巧。这里有一个关于这些技巧的指南。
制作视频
最佳动画工具:D-iD 最佳语音克隆:ElevenLabs
现在,生成一个完全由AI生成的角色(您可以使用本指南中的技术生成的图像)的视频、阅读完全由AI编写的剧本、以AI制作的声音说话、由AI制作的动画已经变得非常简单。
它还可以进行深度伪造,正如在这个链接中,我伪造了我自己。使用说明和更多信息在这里。谨慎使用,但这对解释视频和介绍非常有用。而且在几个月内,您可能会根据文本提示生成视频,敬请关注。
需要注意的事情:深度伪造是一个巨大的问题,这些系统需要在道德上使用。
编码
如果您知道如何编码:ChatGPT-3.5 如果您不知道:ChatGPT-4
GPT-3.5 是一个强大的编码伙伴。但 GPT-4 则是一个新的层次。我一直在用它来用 Python 和 Unity 编写程序(我完全不知道的编程语言!)只要用词告诉它我想要什么:“我需要创建一个亚马逊 Echo 技能,在我大喊派对时让我的色温灯闪烁绿色和蓝色。你能创建吗?”它做到了,现在我的灯可以闪烁蓝色和绿色了。它告诉我下载哪些文件,访问哪些网站以及如何进行操作。当出现错误时,我只需将它们粘贴进去,它就会纠正代码并告诉我如何解决问题。我根本不需要了解任何知识。现在你可以编码了。试试看。
学习东西
开源选项:暂无(但请继续关注) 最佳免费选择:Bing 和 ChatGPT 3.5 付费选项:ChatGPT 4.0 / ChatGPT 带插件
AI 可以成为强大的学习和探索工具。我已经写过关于如何使用它进行教学以及如何帮助让教师的生活更轻松、课程更有效的文章,但是它也可以用于自主学习。以下是在 ChatGPT 中使用它的一些方法:
总结文本。我粘贴了许多复杂的学术文章,并要求它总结结果,它做得很好!(尽管要记住大小限制)。更好的是,您可以通过提问来进一步调查材料:这种方法的证据是什么?作者得出了什么结论?等等…
帮助理解概念。您可以要求 AI 解释概念。由于我们知道 AI 可能会产生幻觉,您最好谨慎地根据另一个来源对其结果进行双重检查。这既帮助您学习,也确保 AI 输出看起来不错。一旦您确信它是正确的,要求它用不同的方式解释,“就像我是10岁的孩子”或者“用《办公室》剧本的形式”或者“在医学检查的背景下”。再次强调,这只是您学习之旅的开始,因为它经常会弄错细节。
解释错误:如果您犯了错误,将错误的文本粘贴并要求它解释错误,或逐步引导您。结果可能会非常有帮助。
需要注意的事情:如果您不检查幻觉,您可能会被教授错误的信息。将 AI 作为您自己研究的起点,而不是任何事情的最终权威。此外,如果它未连接到互联网,它会编造东西。
还有更多吗?
这仅仅是个开始。AI 正在迅速改进,人们不断开发新的用途。但是请记住两个关键点:
AI 是一种工具。它并非总是合适的工具。在考虑将其应用于您计划使用的目的时,请仔细考虑它的优缺点。您需要了解许多道德问题。AI 可以用于侵犯版权,或者作弊,或者窃取他人的作品,或者操纵。并且特定 AI 模型的构建方式以及谁从其使用中受益通常是复杂的问题,在这个阶段并不特别清楚。最终,您有责任以道德的方式使用这些工具。
我们正处于一个迅速发展的革命的初期阶段。您是否还有其他想要分享的用途?请在评论中告诉我。
AI 技术的发展正处于一个快速发展的阶段,我们可能会看到更多有趣的用途和想法。您可以在职场中使用 AI 进行辅助决策、市场研究、竞争对手分析等。同时,在个人层面上,AI 可以帮助您制定健康计划、管理日常任务、提高时间管理能力等。
AI 还可以在艺术和娱乐领域发挥重要作用,例如为音乐家生成音乐、为设计师提供设计灵感、为导演编写剧本等。此外,AI 已经开始在新闻编辑、翻译和客户服务等领域取得突破。
尽管 AI 技术有很多优点,但我们也应该注意到它可能带来的潜在风险。例如,AI 可能会加剧就业岗位的流失,使某些行业的工作岗位减少。此外,随着 AI 的普及,隐私和安全问题也变得越来越重要。因此,在使用 AI 时,我们需要在创新与道德之间找到平衡。
未来,AI 技术的发展将为我们带来更多的可能性。我们应该积极关注这些变化,并努力确保 AI 的应用能为我们的生活带来更多便利和价值,同时确保我们以道德和负责任的方式使用这些工具。