币界新闻

精准洞察，掌握加密市场的动向！

GitHub热榜登顶：开源版GPT

2024-07-24 13:31 币界新闻

原文来源：量子位

图片来源：由无界 AI? 生成

ChatGPT的代码解释器，用自己的电脑也能运行了。

刚刚有位大神在GitHub上发布了本地版的代码解释器，很快就凭借3k+星标并登顶GitHub热榜。

不仅GPT-4本来有的功能它都有，关键是还可以联网。

ChatGPT“断网”的消息传出后引起了一片哗然，而且一关就是几个月。

这几个月间联网功能一直杳无音讯，现在可算是有解决的办法了。

由于代码是在本地运行，所以除了联网之外，它还解决了网页版的很多其他问题：

3小时只能发50条消息支持的Python模块数量有限处理文件大小有限制，不能超过100MB关闭会话窗口之后，此前生成的文件会被删除

如果没有API，还可以把模型换成开源的Code LLaMa。

这个代码解释器推出之后，很快有网友表示期待一波网页版：

那么我们就来看看这个本地代码解释器到底怎么样吧！

让GPT“重新联网”

既然调用了GPT-4的API，那GPT-4支持的功能自然都能用，当然也支持中文。

关于GPT本身的功能这里就不再一一详细展示了。

不过值得一提的是，有了代码解释器之后，GPT的数学水平提升了好几个档次。

所以这里我们用一个高难度的求导问题来考验一下它，题目是f(x)=√(x+√(x+√x))。

Emmm……这个结果有些抽象，不过应该是提示词的问题，我们修改一下：

然后我们就看到了这样的结果：

这个式子和标准答案长得不太一样，不过是不是格式的问题呢？我们验证了一下：

结果是正确的！

接下来就要进入重头戏了，来看看这个代码解释器的联网功能到底是不是噱头：

比如我们想看一下最近有什么新闻。

程序会首先检查有没有安装必备的模块，如果没有的话会自动安装，然后就开始拉取网页了。

不得不说把整个网页都读取一遍，如果不是在本地运行，看着屏幕上滚动的代码，的确是有些肝儿颤……

然后程序会分析出新闻标题存储在了网友中的什么字段，并进行提取。

好在经历了一番折腾，我们最终得到了想要的结果：

除了让它自行搜索，也可以给出具体的网页让它来分析：

又一次的疯狂加载之后，代码解释器成功复现出了它的自我介绍。

那出了复刻了ChatGPT的联网版本，有没有什么更高级的功能呢？

当然有！比如我们想调整一项系统设置，但不知道怎么操作。

如果用网页版，我们大概率会看到一长串的文字说明，但现在直接交给代码解释器就可以了。

不是给出一大段不知所云的教程，而是自动运行代码，直接一步到位。

除了让GPT-4生成代码，一些代码仓库中的工具，也能通过它来调用。

比如想好给一段视频添加字幕，那么就可以调用replicate上现成的语音识别模块。

由于手边没有现成的素材，这里就展示一下开发者给出DEMO：

代码运行的过程是在本地进行的，所以不用担心视频大小超限。

总之，运行好之后，我们就可以看到字幕出现在视频下方了：

同样，利用这一特性还可以生成、修改文档或图片，或者调用ControlNet由一张静态图生成动画……

理论上，只要性能足够，Python能干的所有事情，它都能完成。

那么，怎么才能体验到这个本地代码解释器呢？

安装方法

作者在GitHub项目页（链接见文末）贴出了一份Colab笔记，有条件的网友可以直接进去体验。

在本地安装也非常简单（前提是安装好了Python），只需要一行“pip install open-interpreter”的代码就能搞定。

安装好后，在终端中输入“interpreter”就能直接启动。

这是程序会要求输入GPT-4的API，如果只有3.5的话，启动时要用“interpreter —fast”。

如果3.5也没有的话，可以直接在这步按回车，或者启动时直接输入“interpreter —local”，切换成Code-LLaMA。

其中包括7B、13B和34B三个版本，规模越小速度越快，越大结果越精确。

如果没有安装Code-LLaMA，按照程序的指示操作就能自动装好。

此外，默认情况下，代码生成之后需要确认才会运行，如果不想每次都确认，可以在启动时在命令后面加上“空格-y”。

常用的命令就介绍到这里了，如果想知道更高级的玩法可以参考作者的Colab笔记。

喜欢的话就赶快体验一下把！

GitHub项目页：https://github.com/KillianLucas/open-interpreter

相关新闻