阿里Java开发手册！

月伴飞鱼2024-08-072025-09-07

下载地址：https://github.com/alibaba/p3c/tree/master

编程规约

命名风格

所有编程相关的命名均不能以下划线或美元符号开始，也不能以下划线或美元符号结束。

如:_name / __name / $Object / name_ / name$ / Object$

类名使用 UpperCamelCase 风格。

以下情形例外：DO / PO / DTO / BO / VO / UID 等。

正例:

ForceCode / UserDO / HtmlDTO / XmlService / TcpUdpDeal / TaPromotion。

反例:

forcecode / UserDo / HTMLDto / XMLService / TCPUDPDeal / TAPromotion。

方法名、参数名、成员变量、局部变量都统一使用 lowerCamelCase 风格。

正例:

localValue / getHttpMessage() / inputUserId

常量命名应该全部大写，单词间用下划线隔开，力求语义表达完整清楚，不要嫌名字长。

正例:

MAX_STOCK_COUNT / CACHE_EXPIRED_TIME

反例:

MAX_COUNT / EXPIRED_TIME

抽象类命名使用 Abstract 或 Base 开头。

异常类命名使用 Exception 结尾。

测试类命名以它要测试的类的名称开始，以 Test 结尾。

POJO 类中的任何布尔类型的变量，都不要加 is 前缀，否则部分框架解析会引起序列化错误。

定义为布尔类型 Boolean isDeleted 的字段，它的 getter 方法也是 isDeleted()，部分框架在反向解析时，误以为对应的字段名称是 deleted，导致字段获取不到，得到意料之外的结果或抛出异常。

包名统一使用小写，点分隔符之间有且仅有一个自然语义的英语单词。

包名统一使用单数形式，但是类名如果有复数含义，类名可以使用复数形式。

正例：

应用工具类包名为 com.alibaba.ei.kunlun.aap.util。

类名为 MessageUtils(此规则参考 spring 的框架结构)。

杜绝完全不规范的英文缩写，避免望文不知义。

反例:

AbstractClass 缩写成 AbsClass。

condition 缩写成 condi。

Function 缩写成 Fu，此类随意缩写严重降低了代码的可阅读性。

在常量与变量命名时，表示类型的名词放在词尾，以提升辨识度。

正例:

startTime / workQueue / nameList / TERMINATED_THREAD_COUNT

反例:

startedAt / QueueOfWork / listName / COUNT_TERMINATED_THREAD

如果模块、接口、类、方法使用了设计模式，在命名时要体现出具体模式。

正例:

public class OrderFactory;

public class LoginProxy;

public class ResourceObserver;

对于 Service 和 DAO 类，基于 SOA 的理念，暴露出来的服务一定是接口，内部的实现类用 Impl 的后缀与接口区别。

正例:

CacheServiceImpl 实现 CacheService 接口。

如果是形容能力的接口名称，取对应的形容词为接口名(通常是 –able 结尾的形容词)。

正例:

AbstractTranslator 实现 Translatable。

枚举类名带上 Enum 后缀，枚举成员名称需要全大写，单词间用下划线隔开。

枚举其实就是特殊的常量类，且构造方法被默认强制是私有。

正例:

枚举名字为 ProcessStatusEnum 的成员名称：SUCCESS / UNKNOWN_REASON

Service / DAO 层方法命名规约:

获取单个对象的方法用 get 做前缀。

获取多个对象的方法用 list 做前缀，复数结尾，如:listObjects

获取统计值的方法用 count 做前缀。

插入的方法用 save / insert 做前缀。

删除的方法用 remove / delete 做前缀。

修改的方法用 update 做前缀。

领域模型命名规约:

数据对象：xxxDO，xxx 即为数据表名。

数据传输对象：xxxDTO，xxx 为业务领域相关的名称。

展示对象：xxxVO，xxx 一般为网页名称。

POJO 是 DO / DTO / BO / VO 的统称，禁止命名成 xxxPOJO。

常量定义

不允许任何魔法值(即未经预先定义的常量)直接出现在代码中。

long 或 Long 赋值时，数值后使用大写 L，不能是小写 l，小写容易跟数字混淆，造成误解。

比如：public static final Long NUM = 2l; 写的是数字的 21，还是 Long 型的 2?

浮点数类型的数值后缀统一为大写的 D 或 F。

正例：

public static final double HEIGHT = 175.5D;

public static final float WEIGHT = 150.3F;

不要使用一个常量类维护所有常量，要按常量功能进行归类，分开维护。

正例:

缓存相关常量放在类 CacheConsts 下。

系统配置相关常量放在类 SystemConfigConsts 下。

如果变量值仅在一个固定范围内变化用 enum 类型来定义。

OOP规约

相同参数类型，相同业务含义，才可以使用的可变参数，参数类型避免定义为 Object。

可变参数必须放置在参数列表的最后。

建议开发者尽量不用可变参数编程。

Object 的 equals 方法容易抛空指针异常，应使用常量或确定有值的对象来调用 equals。

正例:

"test".equals(param);

反例:

param.equals("test");

推荐使用 JDK7 引入的工具类 java.util.Objects#equals(Object a, Object b)

所有整型包装类对象之间值的比较，全部使用 equals 方法比较。

任何货币金额，均以最小货币单位且为整型类型进行存储。

浮点数之间的等值判断，基本数据类型不能使用 == 进行比较，包装数据类型不能使用 equals 进行判断。

使用 BigDecimal 来定义值，再进行浮点数的运算操作。

BigDecimal 的等值比较应使用 compareTo() 方法，而不是 equals() 方法。

equals() 方法会比较值和精度(1.0 与 1.00 返回结果为 false)，而 compareTo() 则会忽略精度。

定义数据对象 DO 类时，属性类型要与数据库字段类型相匹配。

正例:

数据库字段的 bigint 必须与类属性的 Long 类型相对应。

禁止使用构造方法 BigDecimal(double) 的方式把 double 值转化为 BigDecimal 对象。

BigDecimal(double) 存在精度损失风险，在精确计算或值比较的场景中可能会导致业务逻辑异常。

如: BigDecimal g = new BigDecimal(0.1F);

实际的存储值为:0.100000001490116119384765625

优先推荐入参为 String 的构造方法，或使用 BigDecimal 的 valueOf 方法，此方法内部其实执行了 Double 的 toString，而 Double 的 toString 按 double 的实际能表达的精度对尾数进行了截断。

1 2	BigDecimal recommend1 = new BigDecimal("0.1"); BigDecimal recommend2 = BigDecimal.valueOf(0.1);

基本数据类型与包装数据类型的使用标准:

所有的 POJO 类属性必须使用包装数据类型。

RPC 方法的返回值和参数必须使用包装数据类型。

所有的局部变量使用基本数据类型。

POJO 类属性没有初值是提醒使用者在需要使用时，必须自己显式地进行赋值，任何 NPE 问题，或者入库检查，都由使用者来保证。

正例:

数据库的查询结果可能是 null，因为自动拆箱，用基本数据类型接收有 NPE 风险。

反例:

某业务的交易报表上显示成交总额涨跌情况，即正负 x%，x 为基本数据类型，调用的 RPC 服务，调用不成功时，返回的是默认值，页面显示为 0%，这是不合理的，应该显示成中划线-。

所以包装数据类型的 null 值，能够表示额外的信息，如：远程调用失败，异常退出。

定义 DO / PO / DTO / VO 等 POJO 类时，不要设定任何属性默认值。

反例:

某业务的 DO 的 createTime 默认值为 new Date();

但是这个属性在数据提取时并没有置入具体值，在更新其它字段时又附带更新了此字段，导致创建时间被修改成当前时间。

序列化类新增属性时，不要修改 serialVersionUID 字段，避免反序列失败。

如果完全不兼容升级，避免反序列化混乱，需要修改 serialVersionUID 值。

serialVersionUID 不一致会抛出序列化运行时异常。

构造方法里面禁止加入任何业务逻辑，如果有初始化逻辑，放在 init 方法中。

POJO 类必须写 toString 方法。

使用 IDE 中的工具 source > generate toString 时，如果继承了另一个 POJO 类，注意在前面加一下super.toString()。

在方法执行抛出异常时，可以直接调用 POJO 的 toString() 方法打印其属性值，便于排查问题。

禁止在 POJO 类中，同时存在对应属性 xxx 的 isXxx() 和 getXxx() 方法。

框架在调用属性 xxx 的提取方法时，并不能确定哪个方法一定是被优先调用到。

使用索引访问用 String 的 split 方法得到的数组时，需做最后一个分隔符后有无内容的检查，

否则会有抛 IndexOutOfBoundsException 的风险。

由于String.Split()的特性，忽略了空值，导致异常。

String str = "a,b,c,,";
String[] ary = str.split(",");
// 预期大于 3，结果等于 3 
System.out.println(ary.length);

当一个类有多个构造方法，或者多个同名方法，这些方法应该按顺序放置在一起，便于阅读。

类内方法定义的顺序依次是：公有方法或保护方法 > 私有方法 > getter / setter 方法。

setter 方法中，参数名称与类成员变量名称一致，this.成员名=参数名。

在 getter/setter 方法中，不要增加业务逻辑，增加排查问题的难度。

循环体内，字符串的连接方式，使用 StringBuilder 的 append 方法进行扩展。

慎用 Object 的 clone 方法来拷贝对象。

对象 clone 方法默认是浅拷贝，若想实现深拷贝需覆写 clone 方法实现域对象的深度遍历式拷贝。

集合处理

hashCode 和 equals 的处理，遵循如下规则:

只要覆写 equals，就必须覆写 hashCode。

因为 Set 存储的是不重复的对象，依据 hashCode 和 equals 进行判断，所以 Set 存储的对象必须覆写这两种方法。

如果自定义对象作为 Map 的键，那么必须覆写 hashCode 和 equals。

判断所有集合内部的元素是否为空，使用 isEmpty() 方法，而不是 size() == 0 的方式。

在某些集合中，前者的时间复杂度为 O(1)，而且可读性更好。

在使用 java.util.stream.Collectors 类的 toMap() 方法转为 Map 集合时，要注意当 value 为 null 时会抛 NPE 异常。

ArrayList 的 subList 结果不可强转成 ArrayList，否则会抛出 ClassCastException 异常。

subList() 返回的是 ArrayList 的内部类 SubList，并不是 ArrayList 本身，而是 ArrayList 的一个视图，对于 SubList的所有操作最终会反映到原列表上。

使用 Map 的方法 keySet()/values()/entrySet() 返回集合对象时，不可以对其进行添加元素操作，否则会抛出UnsupportedOperationException 异常。

Collections 类返回的对象，如:emptyList()/singletonList() 等都是 immutable list，不可对其进行添加或者删除元素的操作。

一旦集合中进行了添加元素的操作，就会触发 UnsupportedOperationException 异常。

在 subList 场景中，高度注意对父集合元素的增加或删除，均会导致子列表的遍历、增加、删除产生ConcurrentModificationException 异常。

使用集合转数组的方法，必须使用集合的 toArray(T[] array)，传入的是类型完全一致、长度为 0 的空数组。

List<String> list = new ArrayList<>(2);
list.add("guan");
list.add("bao");
String[] array = list.toArray(new String[0]);

使用 Collection 接口任何实现类的 addAll() 方法时，要对输入的集合参数进行 NPE 判断。

使用工具类 Arrays.asList() 把数组转换成集合时，不能使用其修改集合相关的方法，它的 add/remove/clear 方法会抛出 UnsupportedOperationException 异常。

泛型通配符<? extends T>来接收返回的数据，此写法的泛型集合不能使用 add 方法。

<? super T>不能使用 get 方法，两者在接口调用赋值的场景中容易出错。

不要在 foreach 循环里进行元素的 remove/add 操作。

remove 元素使用 iterator 方式。

如果并发操作，需要对 iterator 对象加锁。

集合初始化时，指定集合初始值大小。

使用 entrySet 遍历 Map 类集合 KV，而不是 keySet 方式进行遍历。

注意 Map 类集合 K/V 能不能存储 null 值的情况。

集合类	Key	Value	Super	说明
Hashtable	不允许为null	不允许为null	Dictionary	线程安全
ConcurrentHashMap	不允许为null	不允许为null	AbstractMap	锁分段技术（JDK8:CAS）
TreeMap	不允许为null	允许为null	AbstractMap	线程不安全
HashMap	允许为null	允许为null	AbstractMap	线程不安全

利用 Set 元素唯一的特性，可以快速对一个集合进行去重操作，避免使用 List 的 contains() 进行遍历去重或者判断包含操作。

并发处理

获取单例对象需要保证线程安全，其中的方法也要保证线程安全。

创建线程或线程池时请指定有意义的线程名称，方便出错时回溯。

线程资源必须通过线程池提供，不允许在应用中自行显式创建线程。

线程池不允许使用 Executors 去创建，而是通过 ThreadPoolExecutor 的方式。

这样的处理方式让写的同学更加明确线程池的运行规则，规避资源耗尽的风险。

SimpleDateFormat 是线程不安全的类，一般不要定义为 static 变量。

如果定义为 static，必须加锁，或者使用 DateUtils 工具类。

如果是 JDK8 的应用，可以使用 Instant 代替 Date，LocalDateTime 代替 Calendar。

DateTimeFormatter 代替 SimpleDateFormat。

private static final ThreadLocal<DateFormat> dateStyle = new ThreadLocal<DateFormat>() {
	@Override
	protected DateFormat initialValue() {
		return new SimpleDateFormat("yyyy-MM-dd"); 
	}
};

必须回收自定义的 ThreadLocal 变量记录的当前线程的值，尤其在线程池场景下，线程经常会被复用。

如果不清理自定义的 ThreadLocal 变量，可能会影响后续业务逻辑和造成内存泄露等问题。

尽量在代码中使用 try-finally 块进行回收。

objectThreadLocal.set(userInfo);
try {
	// ...
} finally { 
  objectThreadLocal.remove();
}

高并发时，同步调用应该去考量锁的性能损耗。

能用无锁数据结构，就不要用锁。

能锁区块，就不要锁整个方法体，能用对象锁，就不要用类锁。

尽可能使加锁的代码块工作量尽可能的小，避免在锁代码块中调用 RPC 方法。

对多个资源、数据库表、对象同时加锁时，需要保持一致的加锁顺序，否则可能会造成死锁。

线程一需要对表 A、B、C 依次全部加锁后才可以进行更新操作，那么线程二的加锁顺序也必须是 A、B、C，否则可能出现死锁。

在使用阻塞等待获取锁的方式中，必须在 try 代码块之外，并且在加锁方法与 try 代码块之间没有任何可能抛出异常的方法调用。

避免加锁成功后，在 finally 中无法解锁。

在 lock 方法与 try 代码块之间的方法调用抛出异常，无法解锁，造成其它线程无法成功获取锁。

如果 lock 方法在 try 代码块之内，可能由于其它方法抛出异常，导致在 finally 代码块中，unlock 对未加锁的对象解锁。

它会调用 AQS 的 tryRelease 方法(取决于具体实现类)，抛出 IllegalMonitorStateException 异常。

在 Lock 对象的 lock 方法实现中可能抛出 unchecked 异常，产生的后果与二相同。

正例：

Lock lock = new XxxLock();
// ...
lock.lock();
try {
    doSomething();
    doOthers();
} finally {
    lock.unlock();
}

反例：

Lock lock = new XxxLock();
// ...
try {
    // 如果在此抛出异常，会直接执行 finally 块的代码
    doSomething();
    // 不管锁是否成功，finally 块都会执行
    lock.lock();
    doOthers();

} finally {
    lock.unlock();
}

在使用尝试机制来获取锁的方式中，进入业务代码块之前，必须先判断当前线程是否持有锁。

锁的释放规则与锁的阻塞等待方式相同。

Lock 对象的 unlock 方法在执行时，它会调用 AQS 的 tryRelease 方法(取决于具体实现类)。

如果当前线程不持有锁，则抛出 IllegalMonitorStateException 异常。

Lock lock = new XxxLock();
// ...
boolean isLocked = lock.tryLock();
	if (isLocked) {
 		try {
 			doSomething();
 			doOthers();
	 	} finally {
		 	lock.unlock();
 		}
}

并发修改同一记录时，避免更新丢失，需要加锁。

要么在应用层加锁，要么在缓存加锁，要么在数据库层使用乐观锁，使用 version 作为更新依据。

如果每次访问冲突概率小于 20%，推荐使用乐观锁，否则使用悲观锁。

乐观锁的重试次数不得小于 3 次。

资金相关的金融敏感信息，使用悲观锁策略。

乐观锁在获得锁的同时已经完成了更新操作，校验逻辑容易出现漏洞。

另外，乐观锁对冲突的解决策略有较复杂的要求，处理不当容易造成系统压力或数据异常。

所以资金相关的金融敏感信息不建议使用乐观锁更新。

避免 Random 实例被多线程使用，虽然共享该实例是线程安全的，但会因竞争同一seed 导致的性能下降。

通过双重检查锁(double-checked locking)，实现延迟初始化需要将目标属性声明为 volatile 型。

(比如修改 helper 的属性声明为 private volatile Helper helper = null;)。

public class LazyInitDemo {
    private volatile Helper helper = null;
    public Helper getHelper() {
    if (helper == null) {    
        synchronized(this) {  
            if (helper == null) {   
                helper = new Helper();   
            }    
        }   
    }   
    return helper;   
}    
// other methods and fields...   
}

volatile 解决多线程内存不可见问题对于一写多读，是可以解决变量同步问题，但是如果多写，同样无法解决线程安全问题。

如果是 count++ 操作，使用如下类实现:

如果是 JDK8，推荐使用 LongAdder 对象，比 AtomicLong 性能更好(减少乐观锁的重试次数)。

1 2	AtomicInteger count = new AtomicInteger(); count.addAndGet(1);

HashMap 在容量不够进行 resize 时由于高并发可能出现死链，导致 CPU 飙升，在开发过程中注意规避此风险。

ThreadLocal 对象使用 static 修饰，ThreadLocal 无法解决共享对象的更新问题。

这个变量是针对一个线程内所有操作共享的，所以设置为静态变量，所有此类实例共享此静态变量。

也就是说在类第一次被使用时装载，只分配一块存储空间，所有此类的对象(只要是这个线程内定义的)都可以操控这个变量。

控制语句

当 switch 括号内的变量类型为 String 并且此变量为外部参数时，必须先进行 null 判断。

三目运算符 condition ? 表达式 1:表达式 2 中，高度注意表达式 1 和 2 在类型对齐时，可能抛出因自动拆箱导致的 NPE 异常。

以下两种场景会触发类型对齐的拆箱操作:

表达式 1 或表达式 2 的值只要有一个是原始类型。

表达式 1 或表达式 2 的值的类型不一致，会强制拆箱升级成表示范围更大的那个类型。

Integer a = 1;
Integer b = 2;
Integer c = null;
Boolean flag = false;
// a*b的结果是int类型，那么c会强制拆箱成int类型，抛出NPE异常 
Integer result = (flag ? a * b : c);

在高并发场景中，避免使用等于判断作为中断或退出的条件。

如果并发控制没有处理好，容易产生等值判断被击穿的情况，使用大于或小于的区间判断条件来代替。

如：判断剩余奖品数量等于 0 时，终止发放奖品，但因为并发处理错误导致奖品数量瞬间变成了负数，这样的话，活动无法终止。

循环体中的语句要考量性能，以下操作尽量移至循环体外处理：

如定义对象、变量、获取数据库连接，进行不必要的 try-catch 操作(这个 try-catch 是否可以移至循环体外)。

数据库

建表规约

表达是与否概念的字段，必须使用 is_xxx 的方式命名，数据类型是 unsigned tinyint(1 表示是，0 表示否)。

任何字段如果为非负数，必须是 unsigned。

表达逻辑删除的字段名 is_deleted，1 表示删除，0 表示未删除。

表名、字段名必须使用小写字母或数字，禁止出现数字开头禁止两个下划线中间只出现数字。

正例:

aliyun_admin，rdc_config，level3_name

反例:

AliyunAdmin，rdcConfig，level_3_name

表名不使用复数名词。

表名应该仅仅表示表里面的实体内容，不应该表示实体数量，对应于 DO 类名也是单数形式，符合表达习惯。

主键索引名为 pk_字段名。

唯一索引名为 uk_字段名。

普通索引名为 idx_字段名。

小数类型为 decimal，禁止使用 float 和 double。

在存储的时候，float 和 double 都存在精度损失的问题，很可能在比较值的时候，得到不正确的结果。

如果存储的数据范围超过 decimal 的范围，建议将数据拆成整数和小数并分开存储。

如果存储的字符串长度几乎相等，使用 char 定长字符串类型。

varchar 是可变长字符串，不预先分配存储空间，长度不要超过 5000，如果存储长度大于此值，定义字段类型为 text，独立出来一张表，用主键来对应，避免影响其它字段索引率。

表必备三字段:id，create_time，update_time。

其中 id 必为主键，类型为 bigint unsigned、单表时自增、步长为 1。

create_time，update_time 的类型均为 datetime 类型，如果要记录时区信息，那么类型设置为 timestamp。

在数据库中不能使用物理删除操作，要使用逻辑删除。

逻辑删除在数据删除后可以追溯到行为操作。

不过会使得一些情况下的唯一主键变得不唯一，需要根据情况来酌情解决。

表的命名最好是遵循业务名称_表的作用。

正例:

alipay_task / force_project / trade_config / tes_question

库名与应用名称尽量一致。

单表行数超过 500 万行或者单表容量超过 2GB，才推荐进行分库分表。

如果预计三年后的数据量根本达不到这个级别，请不要在创建表时就分库分表。

合适的字符存储长度，不但节约数据库表空间、节约索引存储，更重要的是提升检索速度。

无符号值可以避免误存负数，且扩大了表示范围。

对象	年龄区间	类型	字节	表示范围
人	150 岁之内	tinyint unsigned	1	无符号值：0 到 255
龟	数百岁	smallint unsigned	2	无符号值：0 到 65535
恐龙化石	数千万年	int unsigned	4	无符号值：0 到约 42.9 亿
太阳	约 50 亿年	bigint unsigned	8	无符号值：0 到约 10 的 19 次方

索引规约

业务上具有唯一特性的字段，即使是组合字段，也必须建成唯一索引。

不要以为唯一索引影响了 insert 速度，这个速度损耗可以忽略，但提高查找速度是明显的。

另外，即使在应用层做了非常完善的校验控制，只要没有唯一索引，根据墨菲定律，必然有脏数据产生。

超过三个表禁止 join。

需要 join 的字段，数据类型保持绝对一致。

多表关联查询时，保证被关联的字段需要有索引。

即使双表 join 也要注意表索引、SQL 性能。

在 varchar 字段上建立索引时，必须指定索引长度，没必要对全字段建立索引，根据实际文本区分度决定索引长度。

索引的长度与区分度是一对矛盾体，一般对字符串类型数据，长度为 20 的索引，区分度会高达 90% 以上，可以使用 count(distinct left(列名，索引长度)) / count(*) 的区分度来确定。

页面搜索严禁左模糊或者全模糊，如果需要走搜索引擎来解决。

索引文件具有 B-Tree 的最左前缀匹配特性，如果左边的值未确定，那么无法使用此索引。

如果有 order by 的场景，请注意利用索引的有序性。

order by 最后的字段是组合索引的一部分，并且放在索引组合顺序的最后，避免出现 filesort 的情况，影响查询性能。

正例:

where a = ? and b = ? order by c;索引:a_b_c

反例:

索引如果存在范围查询，那么索引有序性无法利用，如:WHERE a > 10 ORDER BY b;索引 a_b 无法排序。

利用覆盖索引来进行查询操作，避免回表。

用 explain 的结果，extra 列会出现:using index。

利用延迟关联或者子查询优化超多分页场景。

先快速定位需要获取的 id 段，然后再关联:

SELECT t1.* FROM 表 1 as t1 , (select id from 表 1 where 条件 LIMIT 100000 , 20) as t2 where t1.id = t2.id

SQL 性能优化的目标:至少要达到 range 级别，要求是 ref 级别，如果可以是 const 最好。

consts 单表中最多只有一个匹配行(主键或者唯一索引)，在优化阶段即可读取到数据。

ref 指的是使用普通的索引(normal index)。

range 对索引进行范围检索。

explain 表的结果，type = index，索引物理文件全扫描，速度非常慢。

这个 index 级别比较 range 还低，与全表扫描是小巫见大巫。

建组合索引的时候，区分度最高的在最左边。

正例:

如果 where a = ? and b = ?，a 列的几乎接近于唯一值，那么只需要单建 idx_a 索引即可。

存在非等号和等号混合判断条件时，在建索引时，请把等号条件的列前置。

如:where c > ? and d = ? 那么即使 c 的区分度更高，也必须把 d 放在索引的最前列，即建立组合索引 idx_d_c。

防止因字段类型不同造成的隐式转换，导致索引失效。

SQL语句

不要使用 count(列名) 或 count(常量) 来替代 count(*)，count(*) 是 SQL92 定义的标准统计行数的语法，跟数据库无关，跟 NULL 和非 NULL 无关。

count(*) 会统计值为 NULL 的行，而 count(列名) 不会统计此列为 NULL 值的行。

count(distinct col) 计算该列除 NULL 之外的不重复行数。

注意 count(distinct col1 , col2) 如果其中一列全为 NULL，那么即使另一列有不同的值，也返回为 0。

当某一列的值全是 NULL 时，count(col) 的返回结果为 0。

但 sum(col) 的返回结果为 NULL，因此使用 sum() 时需注意 NPE 问题。

可以使用如下方式来避免 sum 的 NPE 问题:

SELECT IFNULL(SUM(column) , 0) FROM table;

SQL 语句中表的别名前加 as，并且以 t1、t2、t3、…的顺序依次命名。

别名可以是表的简称，或者是依照表在 SQL 语句中出现的顺序，以 t1、t2、t3 的方式命名。

别名前加 as 使别名更容易识别。

正例:

select t1.name from first_table as t1 , second_table as t2 where t1.id = t2.id;

in 操作能避免则避免，若实在避免不了，需要仔细评估 in 后边的集合元素数量，控制在 1000 个之内。

因国际化需要，所有的字符存储与表示，均采用 utf8mb4 字符集，字符计数方法需要注意。

说明:

SELECT LENGTH("轻松工作");--返回为 12

SELECT CHARACTER_LENGTH("轻松工作");--返回为 4

表情需要用 utf8mb4 来进行存储，注意它与 utf8 编码的区别。