🤖 AI 魔法课堂
AI 可以画画、写诗、作曲……但它是真的"懂"艺术吗?先来一个小测试——下面4张作品,有些是 AI 生成的,有些是人类画的。你能分辨吗?
点击每张画,选择你的判断,然后点「揭晓答案」!
🤔 为什么这么难分辨?
因为 AI 学习了数十亿张图片里的规律——什么样的线条、色彩、构图会让人觉得"好看"。它不是在"想象",而是在用数学重新组合这些规律。这节课就来揭开这个秘密。
AI 不是把图片、文字"记住"——它把所有东西都变成数字,然后把意思相近的东西放在"地图"上相近的位置。这叫做向量(Vector)。
🎵 比喻:音乐的感觉
你不用记住每首歌的每个音符,但你知道「快乐的音乐」和「悲伤的音乐」听起来不一样。AI 也一样——它把「猫」和「爪子」放在地图上很近的位置,因为它们经常一起出现。
点击下面地图上的任意词语,看看它的"邻居们":
👆 点击任意词语,看它和哪些词"住得近"
💡 编程小知识:「向量」就是一串数字。比如「猫」= [0.8, 0.2, 0.9, …](共768个数字)。数字越像,意思越接近。程序员可以用数学计算两个词有多"相似"——这就是AI理解语言的秘密。
生成式AI用的核心技术叫扩散模型(Diffusion Model)——它的工作方式让人吃惊:先把画面变成一片随机噪点,再一步步把噪点"去掉",直到图像慢慢浮现。
📸 比喻:暗房冲洗照片
胶片时代,照片要在暗房里慢慢显影——一开始什么都看不出来,在化学液体里泡着,图像才一点点出现。扩散模型就像反过来的这个过程:从"什么都看不见"开始,一步步把图像"冲"出来。
选一个主题,然后拖动滑块——看看 AI 是怎么从一片雪花噪点里"想象"出图像的:
🎚️ 去噪步骤
纯噪点清晰图像
👆 拖动滑块到中间,看看 AI 脑中模糊的"幽灵图"!
告诉 AI 你想要什么,它就画什么——这就是提示工程(Prompt Engineering)。一个好的 Prompt 是由多个「参数」组合而成的。
选择下面三行的选项,看看你组合出的 Prompt 会让 AI 画出什么:
🎯 主题(Subject)
🎨 风格(Style)
💫 心情(Mood)
🤖 生成的 Prompt
✨ 如果真的发给AI,它可能会画出这样的画:
💡 编程钩子:你刚才选的「主题」「风格」「心情」,在程序里叫做「参数(Parameters)」——就像 Scratch 里你往积木里拖进去的那个数字或颜色。
函数 generateImage(subject="猫", style="水彩", mood="开心")——这就是程序员写出来的样子。
你用过 Scratch 吗?里面的积木其实就是编程的基础。而编程的基础,正是 AI 运转的底层逻辑。点击每一行,看看它们的联系:
"你在 Scratch 里做的事,和 AI 做的事是同一件事——
只是规模不同。"
程序员用数字创造艺术。
这就是你可以成为的人。
生成式AI不只会画画——它正在改变创作的每一个领域。点击任意卡片,看看你也能参与的方式:
🎯 关键:这些都需要程序员
Midjourney 需要工程师写扩散模型的代码。Suno 需要工程师设计音频神经网络。Sora 需要工程师实现视频生成架构。
每一个"魔法"背后,都有一个会编程的人。
- 生成式AI不是"记住"图片,而是学习数十亿张图里的规律,用数学重新创造
- 扩散模型从随机噪点出发,一步步"去噪",让图像慢慢浮现——像暗房里的照片
- AI把意思相近的词放在"地图"上相近的位置,这叫向量(Vector)
- Prompt 是参数的组合:主题 + 风格 + 心情,就是程序里的函数传参
- Scratch的随机数 → Python的random() → AI的噪点:同一件事,不同规模
- 生成式AI能创造图像、音乐、故事、视频、代码——背后都有程序员