AI相关
- AIGC
- ChatGPT
- Dify
- Ollama
- Sora
- 提示词工程

Web3相关
- MetaMask
- 以太坊
- 区块链

业务相关
- 优惠券业务
- 广告业务
- 推荐业务
- 用户增长

中间件
- Dubbo
- Elasticsearch
- Netty
- Solr
- ZooKeeper

代码整洁
- CodeReview
- Redis开发规范
- 代码重构

公众号文章
- Disruptor框架
- ElasticSearch深度分页
- KAFKA高可用
- MySQL锁表
- Redis延时队列
- RocketMQ事务消息
- RocketMQ延时消息
- RocketMQ消息重试
- RocketMQ负载均衡
- RocketMQ顺序消息
- Tomcat线程池
- Web实时通信
- 动态代理
- 幂等性设计
- 架构设计之CQRS
- 正则表达式
- 泛型策略模式
- 缓存一致性
- 缓存常见问题
- 领域设计之仓储模式
- 领域设计之聚合

前端相关
- CSS
- React
- Vue
- 小程序

基础知识
- JVM
- 分布式
- 并发编程
- 爬虫知识
- 设计模式

大数据相关
- DataX
- DolphinScheduler
- Doris
- Flink
- Hadoop
- Hive
- SQOOP
- Spark
- 大数据基础

学习专栏
- 22讲通关Go语言
- 23讲搞定后台架构实战
- RPC实战与核心原理
- 从0开始学大数据
- 从0开始学架构
- 代码之丑
- 大厂晋升指南
- 如何成为学习高手
- 如何设计一个秒杀系统
- 架构设计面试精讲
- 程序员工作法
- 给程序员的职场情商课
- 高并发架构实战课

学习书籍
- 人物书籍
  - 我在北京送快递
- 历史书籍
  - 孙子兵法
  - 明朝那些事儿
- 心理书籍
  - 认知觉醒
- 技能书籍
  - 英语魔法师之语法俱乐部
  - 高效能人士的七个习惯
- 文学书籍
  - 你当像鸟飞往你的山
  - 当下的力量
  - 活着
- 编程书籍
  - Effective Java
  - HBase不睡觉书
  - Java并发编程实战
  - Java并发编程的艺术
  - Java开发手册
  - MySQL技术内幕
  - Redis设计与实现
  - 亿级流量网站架构核心技术
  - 从零开始读懂Web3
  - 代码整洁之道
  - 大型网站技术架构
  - 大型网站系统
  - 深入理解Java虚拟机
  - 程序员修炼之道
  - 程序员必读之软件架构
  - 重构改善既有代码的设计

工作相关
- 公司相关
- 远程工作

工具相关
- Anki
- 实用工具
- 开发工具

成长相关
- 工作相关
- 技术学习
- 电影推荐
- 纪录片推荐
- 面试相关

数据库
- ClickHouse
- DRDS
- HBase
- MongoDB
- MySQL
- Redis
- SQLite
- TIDB

文章学习
- 大厂文章

服务器
- Docker
- Nginx
- Tomcat
- 运维知识

架构相关
- DDD
- 架构图
- 架构学习
- 系统保障
- 系统性能
- 系统设计

框架相关
- Antlr4
- Apollo
- Aviator
- Caffeine
- Canal
- Drools
- Eureka
- Feign
- Guava
- Hystrix
- JWT
- MyBatis
- Nacos
- RPC框架
- Redisson
- Seata
- Sentinel
- ShardingSphere
- Spring
- SpringCloud
- Thrift
- WebRTC
- XXLJOB
- 开源框架

消息队列
- KAFKA
- RabbitMQ
- RocketMQ

源码相关
- RocketMQ
- SpringBoot
- Spring

算法相关
- LeetCode
- 剑指OFFER
- 算法知识
- 面试算法

系统设计
- 12306系统
- 广告系统
- 推荐系统
- 榜单系统
- 消息队列
- 登录系统
- 短链系统
- 社区系统
- 秒杀系统
- 红包系统
- 订单系统

编程语言
- Go基础
- Java基础
- Python基础

英语相关
- 老友记
  - 第一季
  - 第三季
  - 第五季
- 雅思
  - 剑桥雅思听力真题15
  - 剑桥雅思听力真题16
  - 剑桥雅思听力真题18
  - 剑桥雅思听力真题4

计算机基础
- Linux
- 操作系统
- 数据结构
- 网络基础

认知相关
- 保持人间清醒
- 停止比较
- 利己心态
- 告别胡思乱想
- 如何自律
- 学习冥想
- 摆脱内耗
- 缓解负面情绪
- 走出孤独

资料分享
- 其他书籍
- 工具破解
- 编程书籍
- 编程课程

面试题相关
- JVM面试真题
- MySQL面试真题
- Redis面试真题
- 并发编程面试真题
- 操作系统面试真题
- 数据结构面试真题
- 计算机网络面试真题

Sora

月伴飞鱼 2024-06-23 15:20:26

AI相关

赏

支付宝打赏

微信打赏

如果文章对你有帮助，欢迎点击上方按钮打赏作者！

Sora是OpenAI首个视频生成模型，拥有与DALL·E 3的画面质量以及指令能力。

该模型可以帮助用户通过简单的文本描述视频中的内容，即可在短时间内得到一个分钟级别的视频素材。

官方模型首页：https://openai.com/sora

官方研究报告：https://openai.com/research/video-generation-models-as-world-simulators

Sora 能够生成具有多个角色、特定运动类型以及主题和背景的准确细节的复杂场景，并具有以下特性:

理解用户在提示中所要求的内容，而且还理解这些事物在物理世界中的存在方式。

对语言有着深刻的理解，使其能够准确地解释提示，并生成令人信服的字符。

能够表达充满活力的情感。

在一个生成的视频中创建多个镜头，以准确地保存字符和视觉风格。

官方给出来的Prompt生成视频的例子：

一位富有气质的女生走在人来人往的街道上：

视频呈现的效果如同真实摄像机拍摄得到，镜头距离人物由远到静，甚至可以生成人物的细节，模拟特写效果。

20240217084438

生成一段加州淘金热时期的历史录像：

视频画质稍带历史年代感的模糊效果，内容方面模拟了古代村落的景观。

20240217084622

Sora的不足

可能难以非常准确保证模拟复杂场景的物理过程，也可能无法理解因果关系的具体实例。

比如：一个人可能咬了一口饼干，但之后饼干上可能没有咬痕。

该模型还可能混淆提示的空间细节，例如：混淆左右，并可能难以准确描述随着时间发生的事件，比如跟随特定的摄像头轨迹。

赏

支付宝打赏

微信打赏

如果文章对你有帮助，欢迎点击上方按钮打赏作者！

提示词工程