第六节课-珠子老师_笔记
一、造物课
1. Midjourney的原理
- 核心机制:通过将海量图片素材库中的视觉元素拆解为关键词标签,再反向将关键词组合还原为新的视觉元素
- 简化模型:采用”图片→关键词→新图片”的双向转换过程,这种设计直接影响其生成效果的特点和局限
- 理解目的:掌握原理是为了更好地认识工具的适用场景,在实际应用中扬长避短
2. MJ的优点
- 操作门槛:无需专业美术基础,文字输入即可生成图像,极大降低创作门槛
- 视觉质量:内置优质图片数据库,生成的图像具有较高的审美完成度
- 工作效率:相比传统设计流程,能在极短时间内批量产出多种方案(举例:课程中两天完成多组高质量作业图)
- 应用场景:特别适合需要快速迭代视觉方案的时效性项目
3. MJ的缺点
- 修改精度:无法像PS等软件进行像素级精确修改,局部调整困难
- 文化适配:
- 东亚人脸生成常出现日韩特征混淆
- 中国场景易产生”八九十年代”的陈旧感
- 结构理解:难以处理需要明确空间关系的物体(如包装盒的开盖/侧边结构)
- 多主体控制:多个角色交互时会出现元素错位(案例:奥特曼追唐老鸭→出现身体部位错乱)
- 抽象表达:对极简主义或概念性强的设计支持不足
- 输出稳定性:相同提示词可能产生差异结果,甚至自带的图片转文字功能也存在波动
4. MJ的工作流程
- 最佳实践:
- 作为素材库使用(原始素材/合成素材)
- 与其他3D软件配合(如Blender的背景/材质应用)
- 生成无缝贴图制作纹理材质
- 关键词技巧:
- 素材网站分类标签参考
- 利用/describe图转文功能逆向分析
- 第三方工具网站(如replicate.com)
- 维基百科专业术语
- 日常视觉词汇积累库
5. 寻找关键词的方法
1)素材网站关键词提取与AI出图方法
- 素材网站分类检索
- 主流平台:视觉中国、Shutterstock等专业素材网站都提供分类检索功能
- 适用场景:特别适合寻找实景类素材图片,比花瓣网等平台更专业
- 关键词提取技巧
- 关键词位置:每张素材图片详情页下方都会显示完整的关键词标签
- 提取方法:
- 直接复制:可完整复制关键词组(如”茶树春天/植物花蕾/龙井茶/绿色田地”等)
- 组合使用:将多个相关关键词组合形成更精准的描述
- 翻译转换:通过翻译软件转换为英文后用于AI出图
- AI出图工作流
- 完整流程:
- 从素材网站提取中文关键词(如”枝繁叶茂/清明节/茶园种植”)
- 使用DeepL等专业翻译工具转换为英文术语
- 将英文关键词输入Midjourney等AI绘图工具
- 根据生成结果筛选优化
- 效率优势:该方法可快速产出50+张备选图片,大幅提升设计效率
- 风格控制技巧
- 风格关键词:
- 写实风格:添加”photorealist/real life/richer details”等术语
- 水彩风格:使用”watercolor illustration/gold stroke”等描述
- 大师风格:可指定”in the style of Charles Demuth”等艺术家风格参数
- 商业应用案例
- 场景适配:
- 通过”Sunlight/clean and bright home environment”等环境描述词控制氛围
- 使用”Full Length Shot/commercial imagery”等术语确保商业可用性
- 版权注意:最终商用前需确认AI生成图片的版权授权范围
- 场景适配:
2)图到文本功能与叠图功能
- 叠图功能介绍
- 核心方法:通过图到文本功能生成描述文字后,结合叠图功能进行多次迭代生成
- 工作流程:先让AI分析图片生成文本描述,再基于描述文字生成新图片,形成循环优化过程
- 益生菌图片生成文本案例
- 案例展示:以益生菌相关图片为例,演示图片生成多段文本描述的过程
- 选择策略:从生成的4段文本描述中选择最符合预期的版本进行后续处理
- 关键词提取:包含”light white and light cyan”、”elongated forms”、”glazed surfaces”等视觉特征描述
- 文本与图片融合生成新素材
- 融合方法:将选中的文本描述与新图片叠加,生成特定风格的素材
- 风格控制:通过添加”hd,c4d,oc,3d,extreme close-up”等参数控制生成效果
- 应用场景:特别适合制作提案类视觉素材,可快速生成多种风格方案
- 排版与提案类型应用
- 排版应用:生成的素材可直接用于产品包装等商业设计场景
- 效率优势:相比传统设计流程可大幅缩短提案制作时间
- 图片分析与再生成
- 分析流程:将图片输入AI系统自动分解为多组文本描述
- 随机性特点:同一图片每次分析可能产生不同结果,存在不可控因素
- 优化策略:通过多次尝试选择最佳分析结果作为基础
- 图片生成效果评估
- 质量波动:生成效果存在较大随机性,部分结果可能不理想
- 选择标准:从多组生成结果中筛选最具潜力的版本进行优化
- 典型问题:可能出现”很脏的小金属颗粒”等不符合预期的效果
- 图片生成流程演示
- 完整流程:
- 原始图片输入
- 生成多组文本描述
- 选择最优描述生成新图
- 评估并迭代优化
- 关键技巧:通过”叠图”方法将优选图片与文本描述再次融合
- 图片风格调整与再生成
- 调整方法:在文本描述中添加风格限定词如”clean and streamlined”
- 参数优化:通过调整”-ar 11:8″等参数控制图片比例和细节
- 失败案例:添加”护盾”元素导致生成质量下降的教训
- 图片效果对比与选择
- 选择策略:在多组生成结果中选择最干净、符合预期的版本
- 基准图片:使用简洁干净的图片作为叠图基础效果更好
- 迭代优化:通过3-4轮生成-选择循环逐步接近理想效果
- 图片生成策略讨论
- 两种路径:
- 快速方案:直接使用AI生成的文本描述
- 精细方案:自行研究关键词组合
- 选择依据:根据项目时间要求和质量需求灵活选择
- 两种路径:
- 图片生成效果总结
- 核心优势:快速生成多样化设计方案
- 主要局限:存在随机性,需要人工筛选和引导
- 适用场景:概念设计、提案制作等需要快速可视化的环节
- 图片风格调整与细节优化
- 锐度调整:添加”precisionist lines”等参数增强细节表现
- 层次优化:通过”extreme close-up”等参数控制景深和层次
- 材质表现:使用”glossy finish”等描述改善材质质感
3)第三方拆词网站与叠图功能
- 拆词网站的功能与限制
- 核心功能:通过methexis-inc/img2prompt工具,输入图像可生成近似文本提示词(针对Stable Diffusion优化)
- 典型输出:示例生成”a man in a boat…storybook illustration”等包含风格描述的复合提示词
- 准确性问题:存在性别误判等错误(如将女性识别为男性),主要因为训练数据侧重SD而非Midjourney
- 技术指标:处理速度约22.1秒/张,累计运行96.45万次
- 拆词网站的使用场景
- 图像理解困难时:当完全无法解读图像内容或风格特征不明确时
- 风格参考辅助:对商业插画等专业风格进行提示词逆向工程
- 双工具验证:可与手动拆词结果交叉验证,提高提示词准确性
- 拆词网站与手动拆词的区别
- 模型差异:基于Stable Diffusion的CLIP模型,与Midjourney的提示词解析逻辑存在差异
- 应用互补:可作为手动拆词的补充参考,但不可完全替代人工分析
- 案例对比:商业插画案例中,自动拆词结果需要人工修正风格细节
- 拆词网站在实际应用中的案例
- 二维三维插画:成功应用于商业插画教案制作
- 扁平风格处理:对偏扁平化风格的处理效果优于Midjourney原生拆词
- 叠图功能及写词方法
- niji5特性:风格控制更稳定,相同提示词下风格跳跃小于v5/v4
- 扁平化优势:特别适合二维设计需求,可直接生成基础素材
- 后期处理:生成的插画仍需PS修补,存在元素融合问题(如文字排版)
- 如何让AI理解主体物
- 主体突出原则:通过环境描述弱化干扰元素(如将”大理石覆盖”改为”高档大理石桌面环境”)
- 验证方法:观察四宫格输出中符合预期的比例,调整提示词方向
- 动态调整:需根据每次生成结果灵活调整策略,无固定解决方案
- 叠图功能在电商产品图中的应用
- 成片率优势:v5版本摄影图真实度达商用级别,特别适合不透明物体
- 光影参考:可直接提取生成图中的光影效果用于实际产品合成
- 效率对比:比传统摄影+修图流程更高效,适合电商快速出图需求
- 使用叠图功能时的注意事项
- 语义歧义:注意”orange”可能被识别为水果/颜色,需明确添加”color”等限定词
- 概率问题:同一提示词可能产生不同结果,需选择最接近需求的版本
- 混合工作流:建议结合电图+PS+AI工具,避免过度依赖单一生成方式
6. 各种纯色图
- 描述: 纯色渐变背景具有柔和模糊的自然过渡效果,颜色包括红色、蓝色和白色,线条渐变,具有阿拉伯风格。
- 用途: 特别适合制作PPT背景,通过改变颜色、线条和艺术家风格,可以快速生成多样化的纯色背景。
7. logo的七大风格
- 七大风格: 卡通风格、徽章式、首字母组合、吉祥物/人物、图形+文字组合、文字、抽象。
- 适用风格: 在logo设计中,卡通风格和徽章式是最能够快速生成想要东西的两种风格。
1)例题:咖啡馆logo设计
- 题目要求: 设计一个咖啡馆的logo,需要包含与猫、咖啡相关的元素。
- 推荐艺术家: 查尔斯·伯恩斯(Charles Burns),其风格具有小树苗、多排线、版画等特点。
- 描述词汇: 使用描述词汇如“可爱的”、“全身的”来定义猫的形象。
- 背景颜色: 选择黑色和白色背景,方便在AI中进行矢量化。
- 风格替换: 可以将风格替换为北欧风格,以获取不同风格的猫形象。
8. 混音修改问题
- 开启方法: 在设置中将混音打开,按V键时即可形成修改。
9. MJ的新土豪功能
- 功能名称: –repeat
- 使用限制: 仅适用于快速模式(fast mode)
- 功能说明: 该功能允许用户一次性生成多张图片,但会消耗快速模式的时间配额
- 使用方法: 在提示词(prompt)末尾添加” –repeat 数字”后缀,数字表示要同时运行的生成任务数量
- 示例演示: 老师演示了输入”spring, tea trees… -v5 -repeat 6″命令,表示一次性生成6张茶园主题图片
1)功能特点
- 消耗机制:
- 时间消耗: 会按生成数量成倍消耗快速模式时间
- 金钱成本: 快速模式时间等同于金钱成本,使用需谨慎
- 执行流程:
- 系统会询问确认后开始处理
- 显示”6 out of your 6 jobs are being processed”表示任务已接收
- 取消机制: 生成过程中可以取消任务,但可能无法完全避免时间消耗
2)使用建议
- 适用场景: 需要快速批量生成图片时使用
- 注意事项:
- 确保账户有充足的快速模式时间
- 建议先测试单张生成效果再使用批量功能
- 取消任务可能无法完全避免时间消耗
- 未来优化: 老师预测系统可能会优化取消机制,减少用户时间损失
3)相关功能
- 信息查询: 使用”info”命令可查看账户状态和成就
- 社区支持:
- 可通过Discord的member support频道获取帮助(需使用英文)
- 达到特定生成数量(1000/2500/5000/10000张)可解锁隐藏社区频道
- 问题反馈: 系统会通过公告告知已知问题和修复进度
10. 艺术风格的网站
- 获取方式: 网站链接可在群共享文件的第三个共享中找到
- 分类方式:
- 按艺术领域分类:摄影、建筑等
- 按艺术风格分类
- 艺术家模型测试:
- 可查看艺术家在不同模型(V4/V5/Niji)下的出图效果
- 例如:某艺术家在Niji模型下的出图情况
- 资源规模: 已收集2000多种艺术风格
- 艺术家类型: 包含建筑师、设计师、时尚设计师、电影人、画家等
- 使用技巧:
- 在关键词后添加特定艺术家名称会显著改变生成效果
- 例如添加建筑设计师可能将产品特色元素融入生成图中
- 可能出现四格图中一格显示产品,其他三格为纯背景的情况
11. 提示词网站
- 注册方式: 支持QQ邮箱注册
- 核心功能:
- 通过拖拽图片自动生成描述文字
- 分析时间约1-2分钟
- 使用体验:
- 生成结果可能与原图关联性不强
- 人物生成质量受模型版本影响显著
- 模型选择建议:
- 二维内容创作推荐使用Niji5模型
- V5模型生成的人物效果可能不够理想
- 多人场景生成技巧:
- 可通过选择擅长多人场景的艺术家风格实现
- 避免对每个角色进行详细描述,否则可能导致主角不明确
- 更适合整体场景描写而非个体特征指定
1)作业要求
- 内容要求: 输出4张构图相似但风格不同的图片
- 提交时间: 15号晚上11点截止
- 提交方式: 作业会发布在群内
二、连麦答疑
1. AI工具应用建议
- 审美积累重要性:使用MJ等AI工具后,需要依靠个人审美积累和软件结合能力进行深入研究,建议多阅读艺术史和摄影书籍
- 实际工作应用:AI生成图像在实际工作中尚未达到颠覆性效果,目前仍存在明显AI痕迹,与专业要求存在差距
- 岗位发展建议:AI相关岗位(如AI建模师、AI插画师)仍需扎实的专业基础,AI应作为专业技能的拓展工具而非替代
2. MJ与SD工具对比
- MJ特点:
- 泛用性好,基于大量优质素材训练
- 适合快速生成参考图和背景素材
- 无需考虑模型选择和风格适配
- SD特点:
- 模型种类丰富(大模型+微调模型/Lora)
- 插件系统复杂但拓展性高
- 适合专业领域的精细化调整
- 工作流建议:可先用MJ生成初稿,再导入SD进行优化
3. 硬件配置建议
- 最低配置:显卡GTX3060,内存6GB
- 推荐配置:内存8GB以上
- 模型选择:SD默认动漫风格,需自行下载所需画风的专业模型
4. 职业发展建议
- 作品集建议:
- 增加AI应用专门板块
- 展示AI推导实际案例
- 目前约50%设计岗位要求掌握AI工具
- 能力要求变化:
- 基础设计能力要求反而提升
- 需要强化感知力和情绪表达能力
- 提案成熟度比AI使用更重要
5. 学习建议
- 审美提升:
- 长期使用MJ可培养图像质量判断力
- 增加艺术家和画风知识储备
- 提升创作理念表达能力
- 持续学习:
- 关注国外视频和论坛更新
- 使用翻译工具克服语言障碍
- 保持工具迭代的学习跟进
三、知识小结
声明:本站资源大多来自网络收集,网友上传,如有侵犯你的权益请联系管理员,我们会第一时间进行审核删除。 软件以及教程的相关资源下载仅限个人用户基于测试或者学习之用,提示切勿用于商业目的,如用于商业目的请支持正版,用于商业目的的一切后果与本站无关。 本站提供该软件或资源的官方原版下载,软件版权归其软件公司或原作者所有,请在二十四小时内删除。


评论(0)