卢帅2023AI造物计划团练课第1期【画质还行】-自学窝

第六节课-珠子老师_笔记

一、造物课

06:59

1. Midjourney的原理

07:21

核心机制：通过将海量图片素材库中的视觉元素拆解为关键词标签，再反向将关键词组合还原为新的视觉元素
简化模型：采用”图片→关键词→新图片”的双向转换过程，这种设计直接影响其生成效果的特点和局限
理解目的：掌握原理是为了更好地认识工具的适用场景，在实际应用中扬长避短

2. MJ的优点

08:35

操作门槛：无需专业美术基础，文字输入即可生成图像，极大降低创作门槛
视觉质量：内置优质图片数据库，生成的图像具有较高的审美完成度
工作效率：相比传统设计流程，能在极短时间内批量产出多种方案（举例：课程中两天完成多组高质量作业图）
应用场景：特别适合需要快速迭代视觉方案的时效性项目

3. MJ的缺点

09:24

修改精度：无法像PS等软件进行像素级精确修改，局部调整困难
文化适配：
- 东亚人脸生成常出现日韩特征混淆
- 中国场景易产生”八九十年代”的陈旧感
结构理解：难以处理需要明确空间关系的物体（如包装盒的开盖/侧边结构）
多主体控制：多个角色交互时会出现元素错位（案例：奥特曼追唐老鸭→出现身体部位错乱）
抽象表达：对极简主义或概念性强的设计支持不足
输出稳定性：相同提示词可能产生差异结果，甚至自带的图片转文字功能也存在波动

4. MJ的工作流程

12:01

最佳实践：
- 作为素材库使用（原始素材/合成素材）
- 与其他3D软件配合（如Blender的背景/材质应用）
- 生成无缝贴图制作纹理材质
关键词技巧：
- 素材网站分类标签参考
- 利用/describe图转文功能逆向分析
- 第三方工具网站（如replicate.com）
- 维基百科专业术语
- 日常视觉词汇积累库

5. 寻找关键词的方法

13:12

1）素材网站关键词提取与AI出图方法

13:37

素材网站分类检索
- 主流平台：视觉中国、Shutterstock等专业素材网站都提供分类检索功能
- 适用场景：特别适合寻找实景类素材图片，比花瓣网等平台更专业
关键词提取技巧
- 关键词位置：每张素材图片详情页下方都会显示完整的关键词标签
- 提取方法：
  - 直接复制：可完整复制关键词组（如”茶树春天/植物花蕾/龙井茶/绿色田地”等）
  - 组合使用：将多个相关关键词组合形成更精准的描述
  - 翻译转换：通过翻译软件转换为英文后用于AI出图
AI出图工作流
- 完整流程：
  - 从素材网站提取中文关键词（如”枝繁叶茂/清明节/茶园种植”）
  - 使用DeepL等专业翻译工具转换为英文术语
  - 将英文关键词输入Midjourney等AI绘图工具
  - 根据生成结果筛选优化
- 效率优势：该方法可快速产出50+张备选图片，大幅提升设计效率
风格控制技巧
- 风格关键词：
  - 写实风格：添加”photorealist/real life/richer details”等术语
  - 水彩风格：使用”watercolor illustration/gold stroke”等描述
- 大师风格：可指定”in the style of Charles Demuth”等艺术家风格参数
商业应用案例
- 场景适配：
  - 通过”Sunlight/clean and bright home environment”等环境描述词控制氛围
  - 使用”Full Length Shot/commercial imagery”等术语确保商业可用性
- 版权注意：最终商用前需确认AI生成图片的版权授权范围

2）图到文本功能与叠图功能

18:43

叠图功能介绍

18:52
- 核心方法：通过图到文本功能生成描述文字后，结合叠图功能进行多次迭代生成
- 工作流程：先让AI分析图片生成文本描述，再基于描述文字生成新图片，形成循环优化过程
益生菌图片生成文本案例

19:02
- 案例展示：以益生菌相关图片为例，演示图片生成多段文本描述的过程
- 选择策略：从生成的4段文本描述中选择最符合预期的版本进行后续处理
- 关键词提取：包含”light white and light cyan”、”elongated forms”、”glazed surfaces”等视觉特征描述
文本与图片融合生成新素材

19:37
- 融合方法：将选中的文本描述与新图片叠加，生成特定风格的素材
- 风格控制：通过添加”hd,c4d,oc,3d,extreme close-up”等参数控制生成效果
- 应用场景：特别适合制作提案类视觉素材，可快速生成多种风格方案
排版与提案类型应用

19:47
- 排版应用：生成的素材可直接用于产品包装等商业设计场景
- 效率优势：相比传统设计流程可大幅缩短提案制作时间
图片分析与再生成

21:24
- 分析流程：将图片输入AI系统自动分解为多组文本描述
- 随机性特点：同一图片每次分析可能产生不同结果，存在不可控因素
- 优化策略：通过多次尝试选择最佳分析结果作为基础
图片生成效果评估

22:01
- 质量波动：生成效果存在较大随机性，部分结果可能不理想
- 选择标准：从多组生成结果中筛选最具潜力的版本进行优化
- 典型问题：可能出现”很脏的小金属颗粒”等不符合预期的效果
图片生成流程演示

22:48
- 完整流程：
  - 原始图片输入
  - 生成多组文本描述
  - 选择最优描述生成新图
  - 评估并迭代优化
- 关键技巧：通过”叠图”方法将优选图片与文本描述再次融合
图片风格调整与再生成

25:37
- 调整方法：在文本描述中添加风格限定词如”clean and streamlined”
- 参数优化：通过调整”-ar 11:8″等参数控制图片比例和细节
- 失败案例：添加”护盾”元素导致生成质量下降的教训
图片效果对比与选择

27:03
- 选择策略：在多组生成结果中选择最干净、符合预期的版本
- 基准图片：使用简洁干净的图片作为叠图基础效果更好
- 迭代优化：通过3-4轮生成-选择循环逐步接近理想效果
图片生成策略讨论

29:18
- 两种路径：
  - 快速方案：直接使用AI生成的文本描述
  - 精细方案：自行研究关键词组合
- 选择依据：根据项目时间要求和质量需求灵活选择
图片生成效果总结

30:26
- 核心优势：快速生成多样化设计方案
- 主要局限：存在随机性，需要人工筛选和引导
- 适用场景：概念设计、提案制作等需要快速可视化的环节
图片风格调整与细节优化

31:07
- 锐度调整：添加”precisionist lines”等参数增强细节表现
- 层次优化：通过”extreme close-up”等参数控制景深和层次
- 材质表现：使用”glossy finish”等描述改善材质质感

3）第三方拆词网站与叠图功能

32:06

拆词网站的功能与限制

32:10
- 核心功能：通过methexis-inc/img2prompt工具，输入图像可生成近似文本提示词（针对Stable Diffusion优化）
- 典型输出：示例生成”a man in a boat…storybook illustration”等包含风格描述的复合提示词
- 准确性问题：存在性别误判等错误（如将女性识别为男性），主要因为训练数据侧重SD而非Midjourney
- 技术指标：处理速度约22.1秒/张，累计运行96.45万次
拆词网站的使用场景

32:36
- 图像理解困难时：当完全无法解读图像内容或风格特征不明确时
- 风格参考辅助：对商业插画等专业风格进行提示词逆向工程
- 双工具验证：可与手动拆词结果交叉验证，提高提示词准确性
拆词网站与手动拆词的区别

32:50
- 模型差异：基于Stable Diffusion的CLIP模型，与Midjourney的提示词解析逻辑存在差异
- 应用互补：可作为手动拆词的补充参考，但不可完全替代人工分析
- 案例对比：商业插画案例中，自动拆词结果需要人工修正风格细节
拆词网站在实际应用中的案例

33:14
- 二维三维插画：成功应用于商业插画教案制作
- 扁平风格处理：对偏扁平化风格的处理效果优于Midjourney原生拆词
叠图功能及写词方法

34:53
- niji5特性：风格控制更稳定，相同提示词下风格跳跃小于v5/v4
- 扁平化优势：特别适合二维设计需求，可直接生成基础素材
- 后期处理：生成的插画仍需PS修补，存在元素融合问题（如文字排版）
如何让AI理解主体物

35:17
- 主体突出原则：通过环境描述弱化干扰元素（如将”大理石覆盖”改为”高档大理石桌面环境”）
- 验证方法：观察四宫格输出中符合预期的比例，调整提示词方向
- 动态调整：需根据每次生成结果灵活调整策略，无固定解决方案
叠图功能在电商产品图中的应用

38:10
- 成片率优势：v5版本摄影图真实度达商用级别，特别适合不透明物体
- 光影参考：可直接提取生成图中的光影效果用于实际产品合成
- 效率对比：比传统摄影+修图流程更高效，适合电商快速出图需求
使用叠图功能时的注意事项

39:32
- 语义歧义：注意”orange”可能被识别为水果/颜色，需明确添加”color”等限定词
- 概率问题：同一提示词可能产生不同结果，需选择最接近需求的版本
- 混合工作流：建议结合电图+PS+AI工具，避免过度依赖单一生成方式

6. 各种纯色图

40:59

描述: 纯色渐变背景具有柔和模糊的自然过渡效果，颜色包括红色、蓝色和白色，线条渐变，具有阿拉伯风格。
用途: 特别适合制作PPT背景，通过改变颜色、线条和艺术家风格，可以快速生成多样化的纯色背景。

7. logo的七大风格

41:51

七大风格: 卡通风格、徽章式、首字母组合、吉祥物/人物、图形+文字组合、文字、抽象。
适用风格: 在logo设计中，卡通风格和徽章式是最能够快速生成想要东西的两种风格。

1）例题:咖啡馆logo设计

42:38

题目要求: 设计一个咖啡馆的logo，需要包含与猫、咖啡相关的元素。
推荐艺术家: 查尔斯·伯恩斯（Charles Burns），其风格具有小树苗、多排线、版画等特点。
描述词汇: 使用描述词汇如“可爱的”、“全身的”来定义猫的形象。
背景颜色: 选择黑色和白色背景，方便在AI中进行矢量化。
风格替换: 可以将风格替换为北欧风格，以获取不同风格的猫形象。

8. 混音修改问题

48:30

开启方法: 在设置中将混音打开，按V键时即可形成修改。

9. MJ的新土豪功能

48:51

功能名称: –repeat
使用限制: 仅适用于快速模式(fast mode)
功能说明: 该功能允许用户一次性生成多张图片，但会消耗快速模式的时间配额
使用方法: 在提示词(prompt)末尾添加” –repeat 数字”后缀，数字表示要同时运行的生成任务数量
示例演示: 老师演示了输入”spring, tea trees… -v5 -repeat 6″命令，表示一次性生成6张茶园主题图片

1）功能特点

消耗机制:
- 时间消耗: 会按生成数量成倍消耗快速模式时间
- 金钱成本: 快速模式时间等同于金钱成本，使用需谨慎
执行流程:
- 系统会询问确认后开始处理
- 显示”6 out of your 6 jobs are being processed”表示任务已接收
取消机制: 生成过程中可以取消任务，但可能无法完全避免时间消耗

2）使用建议

适用场景: 需要快速批量生成图片时使用
注意事项:
- 确保账户有充足的快速模式时间
- 建议先测试单张生成效果再使用批量功能
- 取消任务可能无法完全避免时间消耗
未来优化: 老师预测系统可能会优化取消机制，减少用户时间损失

3）相关功能

信息查询: 使用”info”命令可查看账户状态和成就
社区支持:
- 可通过Discord的member support频道获取帮助(需使用英文)
- 达到特定生成数量(1000/2500/5000/10000张)可解锁隐藏社区频道
问题反馈: 系统会通过公告告知已知问题和修复进度

10. 艺术风格的网站

57:03

获取方式: 网站链接可在群共享文件的第三个共享中找到
分类方式:
- 按艺术领域分类：摄影、建筑等
- 按艺术风格分类
艺术家模型测试:
- 可查看艺术家在不同模型(V4/V5/Niji)下的出图效果
- 例如：某艺术家在Niji模型下的出图情况
资源规模: 已收集2000多种艺术风格
艺术家类型: 包含建筑师、设计师、时尚设计师、电影人、画家等
使用技巧:
- 在关键词后添加特定艺术家名称会显著改变生成效果
- 例如添加建筑设计师可能将产品特色元素融入生成图中
- 可能出现四格图中一格显示产品，其他三格为纯背景的情况

11. 提示词网站

59:14

注册方式: 支持QQ邮箱注册
核心功能:
- 通过拖拽图片自动生成描述文字
- 分析时间约1-2分钟
使用体验:
- 生成结果可能与原图关联性不强
- 人物生成质量受模型版本影响显著
模型选择建议:
- 二维内容创作推荐使用Niji5模型
- V5模型生成的人物效果可能不够理想
多人场景生成技巧:
- 可通过选择擅长多人场景的艺术家风格实现
- 避免对每个角色进行详细描述，否则可能导致主角不明确
- 更适合整体场景描写而非个体特征指定

1）作业要求

内容要求: 输出4张构图相似但风格不同的图片
提交时间: 15号晚上11点截止
提交方式: 作业会发布在群内

二、连麦答疑

01:06:04

1. AI工具应用建议

审美积累重要性：使用MJ等AI工具后，需要依靠个人审美积累和软件结合能力进行深入研究，建议多阅读艺术史和摄影书籍
实际工作应用：AI生成图像在实际工作中尚未达到颠覆性效果，目前仍存在明显AI痕迹，与专业要求存在差距
岗位发展建议：AI相关岗位（如AI建模师、AI插画师）仍需扎实的专业基础，AI应作为专业技能的拓展工具而非替代

2. MJ与SD工具对比

MJ特点：
- 泛用性好，基于大量优质素材训练
- 适合快速生成参考图和背景素材
- 无需考虑模型选择和风格适配
SD特点：
- 模型种类丰富（大模型+微调模型/Lora）
- 插件系统复杂但拓展性高
- 适合专业领域的精细化调整
工作流建议：可先用MJ生成初稿，再导入SD进行优化

3. 硬件配置建议

最低配置：显卡GTX3060，内存6GB
推荐配置：内存8GB以上
模型选择：SD默认动漫风格，需自行下载所需画风的专业模型

4. 职业发展建议

作品集建议：
- 增加AI应用专门板块
- 展示AI推导实际案例
- 目前约50%设计岗位要求掌握AI工具
能力要求变化：
- 基础设计能力要求反而提升
- 需要强化感知力和情绪表达能力
- 提案成熟度比AI使用更重要

5. 学习建议

审美提升：
- 长期使用MJ可培养图像质量判断力
- 增加艺术家和画风知识储备
- 提升创作理念表达能力
持续学习：
- 关注国外视频和论坛更新
- 使用翻译工具克服语言障碍
- 保持工具迭代的学习跟进

三、知识小结

知识点	核心内容	应用技巧/注意事项	难度系数
Midjourney原理	将图片拆解为视觉元素池再还原生成	理解原理有助于掌握优缺点	★★☆☆☆
优点	易上手/视觉效果佳/效率高	适合快速生成素材	★★☆☆☆
缺点	局部修改困难/中国元素识别差/多物体控制难	需配合PS/AI等工具精修	★★★☆☆
工作流整合	作为素材库使用/搭配Blender等软件	材质生成和背景制作最顺畅	★★★☆☆
关键词获取	素材网站标签提取/图转文功能	视觉中国等网站标签可直接翻译使用	★★☆☆☆
风格控制	使用–v5/–niji等参数控制输出风格	Niji5适合二维插画风格控制	★★★☆☆
多主体处理	突出主体描述/将环境要素弱化	通过关键词权重分配解决	★★★★☆
Logo设计	仅适合卡通和徽章风格	需矢量化后精修	★★★★☆
批量出图	–relax参数实现多任务并行	会消耗快速模式时长	★★☆☆☆
社区资源	官方论坛/Member Support频道	可获取最新功能信息和问题解答	★★☆☆☆
SD对比	模型多样但复杂/适合专业领域	MJ泛用性好/SD可控性强	★★★★☆

18:33

声明：本站资源大多来自网络收集，网友上传，如有侵犯你的权益请联系管理员，我们会第一时间进行审核删除。软件以及教程的相关资源下载仅限个人用户基于测试或者学习之用，提示切勿用于商业目的，如用于商业目的请支持正版，用于商业目的的一切后果与本站无关。本站提供该软件或资源的官方原版下载，软件版权归其软件公司或原作者所有，请在二十四小时内删除。

卢帅2023AI造物计划团练课第1期【画质还行】