第六节课-珠子老师_笔记

一、造物课

06:59
1. Midjourney的原理
07:21
  • 核心机制:通过将海量图片素材库中的视觉元素拆解为关键词标签,再反向将关键词组合还原为新的视觉元素
  • 简化模型:采用”图片→关键词→新图片”的双向转换过程,这种设计直接影响其生成效果的特点和局限
  • 理解目的:掌握原理是为了更好地认识工具的适用场景,在实际应用中扬长避短
2. MJ的优点
08:35
  • 操作门槛:无需专业美术基础,文字输入即可生成图像,极大降低创作门槛
  • 视觉质量:内置优质图片数据库,生成的图像具有较高的审美完成度
  • 工作效率:相比传统设计流程,能在极短时间内批量产出多种方案(举例:课程中两天完成多组高质量作业图)
  • 应用场景:特别适合需要快速迭代视觉方案的时效性项目
3. MJ的缺点
09:24
  • 修改精度:无法像PS等软件进行像素级精确修改,局部调整困难
  • 文化适配
    • 东亚人脸生成常出现日韩特征混淆
    • 中国场景易产生”八九十年代”的陈旧感
  • 结构理解:难以处理需要明确空间关系的物体(如包装盒的开盖/侧边结构)
  • 多主体控制:多个角色交互时会出现元素错位(案例:奥特曼追唐老鸭→出现身体部位错乱)
  • 抽象表达:对极简主义或概念性强的设计支持不足
  • 输出稳定性:相同提示词可能产生差异结果,甚至自带的图片转文字功能也存在波动
4. MJ的工作流程
12:01
  • 最佳实践
    • 作为素材库使用(原始素材/合成素材)
    • 与其他3D软件配合(如Blender的背景/材质应用)
    • 生成无缝贴图制作纹理材质
  • 关键词技巧
    • 素材网站分类标签参考
    • 利用/describe图转文功能逆向分析
    • 第三方工具网站(如replicate.com)
    • 维基百科专业术语
    • 日常视觉词汇积累库
5. 寻找关键词的方法
13:12
1)素材网站关键词提取与AI出图方法
13:37
  • 素材网站分类检索
    • 主流平台:视觉中国、Shutterstock等专业素材网站都提供分类检索功能
    • 适用场景:特别适合寻找实景类素材图片,比花瓣网等平台更专业
  • 关键词提取技巧
    • 关键词位置:每张素材图片详情页下方都会显示完整的关键词标签
    • 提取方法
      • 直接复制:可完整复制关键词组(如”茶树春天/植物花蕾/龙井茶/绿色田地”等)
      • 组合使用:将多个相关关键词组合形成更精准的描述
      • 翻译转换:通过翻译软件转换为英文后用于AI出图
  • AI出图工作流
    • 完整流程
      • 从素材网站提取中文关键词(如”枝繁叶茂/清明节/茶园种植”)
      • 使用DeepL等专业翻译工具转换为英文术语
      • 将英文关键词输入Midjourney等AI绘图工具
      • 根据生成结果筛选优化
    • 效率优势:该方法可快速产出50+张备选图片,大幅提升设计效率
  • 风格控制技巧
    • 风格关键词
      • 写实风格:添加”photorealist/real life/richer details”等术语
      • 水彩风格:使用”watercolor illustration/gold stroke”等描述
    • 大师风格:可指定”in the style of Charles Demuth”等艺术家风格参数
  • 商业应用案例
    • 场景适配
      • 通过”Sunlight/clean and bright home environment”等环境描述词控制氛围
      • 使用”Full Length Shot/commercial imagery”等术语确保商业可用性
    • 版权注意:最终商用前需确认AI生成图片的版权授权范围
2)图到文本功能与叠图功能
18:43
  • 叠图功能介绍
    18:52
    • 核心方法:通过图到文本功能生成描述文字后,结合叠图功能进行多次迭代生成
    • 工作流程:先让AI分析图片生成文本描述,再基于描述文字生成新图片,形成循环优化过程
  • 益生菌图片生成文本案例
    19:02
    • 案例展示:以益生菌相关图片为例,演示图片生成多段文本描述的过程
    • 选择策略:从生成的4段文本描述中选择最符合预期的版本进行后续处理
    • 关键词提取:包含”light white and light cyan”、”elongated forms”、”glazed surfaces”等视觉特征描述
  • 文本与图片融合生成新素材
    19:37
    • 融合方法:将选中的文本描述与新图片叠加,生成特定风格的素材
    • 风格控制:通过添加”hd,c4d,oc,3d,extreme close-up”等参数控制生成效果
    • 应用场景:特别适合制作提案类视觉素材,可快速生成多种风格方案
  • 排版与提案类型应用
    19:47
    • 排版应用:生成的素材可直接用于产品包装等商业设计场景
    • 效率优势:相比传统设计流程可大幅缩短提案制作时间
  • 图片分析与再生成
    21:24
    • 分析流程:将图片输入AI系统自动分解为多组文本描述
    • 随机性特点:同一图片每次分析可能产生不同结果,存在不可控因素
    • 优化策略:通过多次尝试选择最佳分析结果作为基础
  • 图片生成效果评估
    22:01
    • 质量波动:生成效果存在较大随机性,部分结果可能不理想
    • 选择标准:从多组生成结果中筛选最具潜力的版本进行优化
    • 典型问题:可能出现”很脏的小金属颗粒”等不符合预期的效果
  • 图片生成流程演示
    22:48
    • 完整流程
      • 原始图片输入
      • 生成多组文本描述
      • 选择最优描述生成新图
      • 评估并迭代优化
    • 关键技巧:通过”叠图”方法将优选图片与文本描述再次融合
  • 图片风格调整与再生成
    25:37
    • 调整方法:在文本描述中添加风格限定词如”clean and streamlined”
    • 参数优化:通过调整”-ar 11:8″等参数控制图片比例和细节
    • 失败案例:添加”护盾”元素导致生成质量下降的教训
  • 图片效果对比与选择
    27:03
    • 选择策略:在多组生成结果中选择最干净、符合预期的版本
    • 基准图片:使用简洁干净的图片作为叠图基础效果更好
    • 迭代优化:通过3-4轮生成-选择循环逐步接近理想效果
  • 图片生成策略讨论
    29:18
    • 两种路径
      • 快速方案:直接使用AI生成的文本描述
      • 精细方案:自行研究关键词组合
    • 选择依据:根据项目时间要求和质量需求灵活选择
  • 图片生成效果总结
    30:26
    • 核心优势:快速生成多样化设计方案
    • 主要局限:存在随机性,需要人工筛选和引导
    • 适用场景:概念设计、提案制作等需要快速可视化的环节
  • 图片风格调整与细节优化
    31:07
    • 锐度调整:添加”precisionist lines”等参数增强细节表现
    • 层次优化:通过”extreme close-up”等参数控制景深和层次
    • 材质表现:使用”glossy finish”等描述改善材质质感
3)第三方拆词网站与叠图功能
32:06
  • 拆词网站的功能与限制
    32:10
    • 核心功能:通过methexis-inc/img2prompt工具,输入图像可生成近似文本提示词(针对Stable Diffusion优化)
    • 典型输出:示例生成”a man in a boat…storybook illustration”等包含风格描述的复合提示词
    • 准确性问题:存在性别误判等错误(如将女性识别为男性),主要因为训练数据侧重SD而非Midjourney
    • 技术指标:处理速度约22.1秒/张,累计运行96.45万次
  • 拆词网站的使用场景
    32:36
    • 图像理解困难时:当完全无法解读图像内容或风格特征不明确时
    • 风格参考辅助:对商业插画等专业风格进行提示词逆向工程
    • 双工具验证:可与手动拆词结果交叉验证,提高提示词准确性
  • 拆词网站与手动拆词的区别
    32:50
    • 模型差异:基于Stable Diffusion的CLIP模型,与Midjourney的提示词解析逻辑存在差异
    • 应用互补:可作为手动拆词的补充参考,但不可完全替代人工分析
    • 案例对比:商业插画案例中,自动拆词结果需要人工修正风格细节
  • 拆词网站在实际应用中的案例
    33:14
    • 二维三维插画:成功应用于商业插画教案制作
    • 扁平风格处理:对偏扁平化风格的处理效果优于Midjourney原生拆词
  • 叠图功能及写词方法
    34:53
    • niji5特性:风格控制更稳定,相同提示词下风格跳跃小于v5/v4
    • 扁平化优势:特别适合二维设计需求,可直接生成基础素材
    • 后期处理:生成的插画仍需PS修补,存在元素融合问题(如文字排版)
  • 如何让AI理解主体物
    35:17
    • 主体突出原则:通过环境描述弱化干扰元素(如将”大理石覆盖”改为”高档大理石桌面环境”)
    • 验证方法:观察四宫格输出中符合预期的比例,调整提示词方向
    • 动态调整:需根据每次生成结果灵活调整策略,无固定解决方案
  • 叠图功能在电商产品图中的应用
    38:10
    • 成片率优势:v5版本摄影图真实度达商用级别,特别适合不透明物体
    • 光影参考:可直接提取生成图中的光影效果用于实际产品合成
    • 效率对比:比传统摄影+修图流程更高效,适合电商快速出图需求
  • 使用叠图功能时的注意事项
    39:32
    • 语义歧义:注意”orange”可能被识别为水果/颜色,需明确添加”color”等限定词
    • 概率问题:同一提示词可能产生不同结果,需选择最接近需求的版本
    • 混合工作流:建议结合电图+PS+AI工具,避免过度依赖单一生成方式
6. 各种纯色图
40:59
  • 描述: 纯色渐变背景具有柔和模糊的自然过渡效果,颜色包括红色、蓝色和白色,线条渐变,具有阿拉伯风格。
  • 用途: 特别适合制作PPT背景,通过改变颜色、线条和艺术家风格,可以快速生成多样化的纯色背景。
7. logo的七大风格
41:51
  • 七大风格: 卡通风格、徽章式、首字母组合、吉祥物/人物、图形+文字组合、文字、抽象。
  • 适用风格: 在logo设计中,卡通风格和徽章式是最能够快速生成想要东西的两种风格。
1)例题:咖啡馆logo设计
42:38
  • 题目要求: 设计一个咖啡馆的logo,需要包含与猫、咖啡相关的元素。
  • 推荐艺术家: 查尔斯·伯恩斯(Charles Burns),其风格具有小树苗、多排线、版画等特点。
  • 描述词汇: 使用描述词汇如“可爱的”、“全身的”来定义猫的形象。
  • 背景颜色: 选择黑色和白色背景,方便在AI中进行矢量化。
  • 风格替换: 可以将风格替换为北欧风格,以获取不同风格的猫形象。
8. 混音修改问题
48:30
  • 开启方法: 在设置中将混音打开,按V键时即可形成修改。
9. MJ的新土豪功能
48:51
  • 功能名称: –repeat
  • 使用限制: 仅适用于快速模式(fast mode)
  • 功能说明: 该功能允许用户一次性生成多张图片,但会消耗快速模式的时间配额
  • 使用方法: 在提示词(prompt)末尾添加” –repeat 数字”后缀,数字表示要同时运行的生成任务数量
  • 示例演示: 老师演示了输入”spring, tea trees… -v5 -repeat 6″命令,表示一次性生成6张茶园主题图片
1)功能特点
  • 消耗机制:
    • 时间消耗: 会按生成数量成倍消耗快速模式时间
    • 金钱成本: 快速模式时间等同于金钱成本,使用需谨慎
  • 执行流程:
    • 系统会询问确认后开始处理
    • 显示”6 out of your 6 jobs are being processed”表示任务已接收
  • 取消机制: 生成过程中可以取消任务,但可能无法完全避免时间消耗
2)使用建议
  • 适用场景: 需要快速批量生成图片时使用
  • 注意事项:
    • 确保账户有充足的快速模式时间
    • 建议先测试单张生成效果再使用批量功能
    • 取消任务可能无法完全避免时间消耗
  • 未来优化: 老师预测系统可能会优化取消机制,减少用户时间损失
3)相关功能
  • 信息查询: 使用”info”命令可查看账户状态和成就
  • 社区支持:
    • 可通过Discord的member support频道获取帮助(需使用英文)
    • 达到特定生成数量(1000/2500/5000/10000张)可解锁隐藏社区频道
  • 问题反馈: 系统会通过公告告知已知问题和修复进度
10. 艺术风格的网站
57:03
  • 获取方式: 网站链接可在群共享文件的第三个共享中找到
  • 分类方式:
    • 按艺术领域分类:摄影、建筑等
    • 按艺术风格分类
  • 艺术家模型测试:
    • 可查看艺术家在不同模型(V4/V5/Niji)下的出图效果
    • 例如:某艺术家在Niji模型下的出图情况
  • 资源规模: 已收集2000多种艺术风格
  • 艺术家类型: 包含建筑师、设计师、时尚设计师、电影人、画家等
  • 使用技巧:
    • 在关键词后添加特定艺术家名称会显著改变生成效果
    • 例如添加建筑设计师可能将产品特色元素融入生成图中
    • 可能出现四格图中一格显示产品,其他三格为纯背景的情况
11. 提示词网站
59:14
  • 注册方式: 支持QQ邮箱注册
  • 核心功能:
    • 通过拖拽图片自动生成描述文字
    • 分析时间约1-2分钟
  • 使用体验:
    • 生成结果可能与原图关联性不强
    • 人物生成质量受模型版本影响显著
  • 模型选择建议:
    • 二维内容创作推荐使用Niji5模型
    • V5模型生成的人物效果可能不够理想
  • 多人场景生成技巧:
    • 可通过选择擅长多人场景的艺术家风格实现
    • 避免对每个角色进行详细描述,否则可能导致主角不明确
    • 更适合整体场景描写而非个体特征指定
1)作业要求
  • 内容要求: 输出4张构图相似但风格不同的图片
  • 提交时间: 15号晚上11点截止
  • 提交方式: 作业会发布在群内

二、连麦答疑

01:06:04
1. AI工具应用建议
  • 审美积累重要性:使用MJ等AI工具后,需要依靠个人审美积累和软件结合能力进行深入研究,建议多阅读艺术史和摄影书籍
  • 实际工作应用:AI生成图像在实际工作中尚未达到颠覆性效果,目前仍存在明显AI痕迹,与专业要求存在差距
  • 岗位发展建议:AI相关岗位(如AI建模师、AI插画师)仍需扎实的专业基础,AI应作为专业技能的拓展工具而非替代
2. MJ与SD工具对比
  • MJ特点
    • 泛用性好,基于大量优质素材训练
    • 适合快速生成参考图和背景素材
    • 无需考虑模型选择和风格适配
  • SD特点
    • 模型种类丰富(大模型+微调模型/Lora)
    • 插件系统复杂但拓展性高
    • 适合专业领域的精细化调整
  • 工作流建议:可先用MJ生成初稿,再导入SD进行优化
3. 硬件配置建议
  • 最低配置:显卡GTX3060,内存6GB
  • 推荐配置:内存8GB以上
  • 模型选择:SD默认动漫风格,需自行下载所需画风的专业模型
4. 职业发展建议
  • 作品集建议
    • 增加AI应用专门板块
    • 展示AI推导实际案例
    • 目前约50%设计岗位要求掌握AI工具
  • 能力要求变化
    • 基础设计能力要求反而提升
    • 需要强化感知力和情绪表达能力
    • 提案成熟度比AI使用更重要
5. 学习建议
  • 审美提升
    • 长期使用MJ可培养图像质量判断力
    • 增加艺术家和画风知识储备
    • 提升创作理念表达能力
  • 持续学习
    • 关注国外视频和论坛更新
    • 使用翻译工具克服语言障碍
    • 保持工具迭代的学习跟进

三、知识小结

知识点

核心内容

应用技巧/注意事项

难度系数

Midjourney原理

将图片拆解为视觉元素池再还原生成

理解原理有助于掌握优缺点

★★☆☆☆

优点

易上手/视觉效果佳/效率高

适合快速生成素材

★★☆☆☆

缺点

局部修改困难/中国元素识别差/多物体控制难

需配合PS/AI等工具精修

★★★☆☆

工作流整合

作为素材库使用/搭配Blender等软件

材质生成和背景制作最顺畅

★★★☆☆

关键词获取

素材网站标签提取/图转文功能

视觉中国等网站标签可直接翻译使用

★★☆☆☆

风格控制

使用–v5/–niji等参数控制输出风格

Niji5适合二维插画风格控制

★★★☆☆

多主体处理

突出主体描述/将环境要素弱化

通过关键词权重分配解决

★★★★☆

Logo设计

仅适合卡通和徽章风格

需矢量化后精修

★★★★☆

批量出图

–relax参数实现多任务并行

会消耗快速模式时长

★★☆☆☆

社区资源

官方论坛/Member Support频道

可获取最新功能信息和问题解答

★★☆☆☆

SD对比

模型多样但复杂/适合专业领域

MJ泛用性好/SD可控性强

★★★★☆

18:33
声明:本站资源大多来自网络收集,网友上传,如有侵犯你的权益请联系管理员,我们会第一时间进行审核删除。 软件以及教程的相关资源下载仅限个人用户基于测试或者学习之用,提示切勿用于商业目的,如用于商业目的请支持正版,用于商业目的的一切后果与本站无关。 本站提供该软件或资源的官方原版下载,软件版权归其软件公司或原作者所有,请在二十四小时内删除。