AI编程初探 _ 利用Windsurf零代码开发网页对话与图像理解插件

在Cursor大热之后,另一款AI编程工具——Windsurf横空出世,成为与Cursor相抗衡的强劲对手。

由估值高达12.5亿美元的美国初创公司Codeium开发,Windsurf一经发布便迅速引起广泛关注。

该工具结合了协作能力的copilots与独立能力的agents,创造出全新的协作型智能体。

Codeium vs GitHub Copilot

Windsurf被认为是目前最智能的AI代码生成工具,数据证明了这一点。

AI代码生成工具

接下来,我们将使用Windsurf开发一个Chrome浏览器插件,利用智谱AI提供的两个免费多模态模型API。

最终产品的效果大致如下:

网页对话与图像理解插件
支持网页对话和图像理解功能,付费订阅模式尚未开发。

本次API使用的是智谱AI开放的两款免费API:glm-4-flash和glm-4v-flash。

感谢支持的朋友们!不得不说,这些工具实在是太强大了!

GLM-4-Flash的特点

GLM-4-Flash兼具“高速度”和“经济性”,适合处理简单、低成本且需要快速响应的任务。

GLM-4-Flash功能
GLM-4-Flash具备多轮对话、网页浏览、Function Call和长文本推理(支持最大128K上下文)等高级功能,同时支持包括中文、英语、日语、韩语、德语在内的26种语言。

应用场景

  • 数据抽取:生物学家使用GLM-4-Flash处理分子数据,破解健康密码。
  • 数据生成:生成可用于训练其他大模型的数据内容,成为其他领域大模型的“黄埔军校”。
  • 多轮对话:高校学者利用GLM-4-Flash制作AI助教,帮助学生在学习和校园生活中获得支持。
  • 英语翻译:开发者构建翻译APP,帮助小朋友进行英语互动学习。
  • 内容生成:广告公司使用GLM-4-Flash进行文本润色,快速输出各种类型的文案。

GLM-4V-Flash的功能

GLM-4V-Flash模型具备图像描述生成、图像分类、视觉推理、视觉问答(VQA)及图像情感分析等高级图像处理功能,支持26种语言。

图像理解功能
可以用它解读图片生成社交媒体文案,创造引人入胜的内容。

此外,它还可以识图答题,帮助学生构建全面的学习框架;进行美容咨询,识别皮肤问题并提供护肤建议;高效提取保险单信息;根据图像内容进行总结输出。

开发流程

在开始开发之前,首先下载Windsurf并购买会员(可在淘宝上获取,需用到claude)。

接着,创建一个存放代码的文件夹,注意:文件夹名称中不要包含中文和特殊符号。

使用Windsurf打开创建的文件夹,经过一轮对话后,它会帮助搭建大框架并完善需求。

Windsurf界面

通过在Google浏览器的扩展中加载插件,便可开始使用。

加载插件

使用glm-4-flash进行对话能力测试。

对话能力

使用glm-4v-flash进行图像理解能力测试。

功能调试完成后,开始撰写readme文档。

提交Chrome应用商店
最后提交至Chrome应用商店,当前正在处理。

开发完成

以上就是基于Windsurf,从需求分析到开发完成,再到提交Chrome应用商店审核的全过程。

在AI时代的今天,即使没有代码基础,也能从零开始开发一个基础插件,你也可以试试哦!

👉 野卡 | 一分钟注册,轻松订阅海外线上服务

(0)
上一篇 2025年8月13日
下一篇 2025年8月13日

相关推荐