后端搬运工

如何实现一个自定义规则引擎

2024-04-23T13:00:00.000Z

规则引擎的功能可以简化为当满足一些条件时触发一些操作，通常使用 DSL 自定义语法来表述。规则引擎需要先解析 DSL 语法形成语法树，然后遍历语法树得到完整的语法表达式，最后执行这些语法表达式完成规则的执行。

本文以 gengine 来探讨如何设计和实现一个自定义规则引擎。

支持的语句

为了满足基本的业务规则需求，规则引擎应该要支持的语句有：

逻辑与算术运算

数学运算（+、-、*、/）
逻辑运算（&&、||、!）
比较运算（==、!=、>、<、>=、<=）

流程控制

条件（IF ELSE）
循环 (FOR)

高级语句

对象属性访问（对象.属性）
方法调用（func()）

规则语法的解析

规则的 DSL 语法定义应该简单明了，gengine 使用了开源的语法解析器 Antlr4 来定义和解析规则语法。

定义规则语法

规则的 DSL 基本语法格式如下：

rule "rulename" "rule-describtion" salience  10
begin

//规则体

end

其中规则体为具体规则语句，由上述的逻辑与算术运算、流程控制、高级语句组合而成。

例如，判断为一个大额异常订单的规则体：

if Order.Price>= 1000000 {
    return
}

编写解析器语法

Antlr4 解析器语法定义文件后缀名为.g4，以下内容为解析器的语法定义，解析器根据语法定义去逐行解析生成语法树。

这里省略了一些非核心的语法定义并做了简化，完整内容查看 gengine.g4。

grammar gengine;

primary: ruleEntity+;
// 规则定义
ruleEntity:  RULE ruleName ruleDescription? salience? BEGIN ruleContent END;
ruleName : stringLiteral;
ruleDescription : stringLiteral;
salience : SALIENCE integer;
// 规则体
ruleContent : statements;
statements: statement* returnStmt?;

// 基本语句
statement : ifStmt | breakStmt;

expression : mathExpression
            | expression comparisonOperator expression
            | expression logicalOperator expression
            ;

mathExpression : mathExpression  mathMdOperator mathExpression
               | mathExpression  mathPmOperator mathExpression
               | expressionAtom
               | LR_BRACKET mathExpression RR_BRACKET
               ;

expressionAtom
    : functionCall
    | constant
    | variable
    ;
returnStmt : RETURN expression?;
ifStmt : IF expression LR_BRACE statements RR_BRACE elseIfStmt*  elseStmt?;
elseStmt : ELSE LR_BRACE statements RR_BRACE;

constant
    : booleanLiteral
    | integer
    | stringLiteral
    ;
functionArgs
    : (constant | variable  | functionCall | expression)  (','(constant | variable | functionCall | expression))*
    ;
integer : MINUS? INT;
stringLiteral: DQUOTA_STRING;
booleanLiteral : TRUE | FALSE;
functionCall : SIMPLENAME LR_BRACKET functionArgs? RR_BRACKET;
variable :  SIMPLENAME | DOTTEDNAME;
mathPmOperator : PLUS | MINUS;
mathMdOperator : MUL | DIV;
comparisonOperator : GT | LT | GTE | LTE | EQUALS | NOTEQUALS;

// 关键字省略

解析器生成语法树

如，判断为一个大额异常订单的规则：

rule "order-large-price" "订单大额金额" salience 10
begin
    if Order.Price >= 1000000 {
        return
    }
end

语法解析器解析之后，生成语法树：

遍历语法树生成语句表达式

解析器生成语法树之后，只需要遍历语法树即可得到完整的语句表达式。 Antlr4 解析器会生成 Listener 接口，这些接口在遍历语法树时会被调用。

type gengineListener interface {
    antlr.ParseTreeListener
    // 省略了一些只列举了部分方法
    // EnterRuleEntity is called when entering the ruleEntity production.
    EnterRuleEntity(c *RuleEntityContext)
    // ExitRuleEntity is called when exiting the ruleEntity production.
    ExitRuleEntity(c *RuleEntityContext)
    // EnterRuleContent is called when entering the ruleContent production.
    EnterRuleContent(c *RuleContentContext)
    // ExitRuleContent is called when exiting the ruleContent production.
    ExitRuleContent(c *RuleContentContext)
    // EnterStatement is called when entering the statement production.
    EnterStatement(c *StatementContext)
    // ExitStatement is called when exiting the statement production.
    ExitStatement(c *StatementContext)
    // EnterIfStmt is called when entering the ifStmt production.
    EnterIfStmt(c *IfStmtContext)
    // ExitIfStmt is called when exiting the ifStmt production.
    ExitIfStmt(c *IfStmtContext)
    // EnterExpression is called when entering the expression production.
    EnterExpression(c *ExpressionContext)
    // ExitExpression is called when exiting the expression production.
    ExitExpression(c *ExpressionContext)
    // EnterInteger is called when entering the integer production.
    EnterInteger(c *IntegerContext)
    // ExitInteger is called when exiting the integer production.
    ExitInteger(c *IntegerContext)
}

可以发现在遍历语法树时，每个节点都有 EnterXXX() 和 ExitXXX() 方法存在，是成对出现的。

因此要遍历语法树只需要实现 gengineListener 接口即可，gengine 巧妙的引入栈结构，遍历完语法树后（树的递归遍历就是进栈出栈过程），就得到了完整的规则语句表达式。这里只列举部分方法，完整实现见 gengine_parser_listener。

type GengineParserListener struct {
    parser.BasegengineListener

    KnowledgeContext *base.KnowledgeContext
    Stack            *stack.Stack
}

func (g *GengineParserListener) EnterRuleEntity(ctx *parser.RuleEntityContext) {
    if len(g.ParseErrors) > 0 {
        return
    }
    entity := &base.RuleEntity{
        Salience: 0,
    }
    g.ruleName = ""
    g.ruleDescription = ""
    g.salience = 0
    g.Stack.Push(entity)
}

func (g *GengineParserListener) ExitRuleEntity(ctx *parser.RuleEntityContext) {
    if len(g.ParseErrors) > 0 {
        return
    }
    entity := g.Stack.Pop().(*base.RuleEntity)
    g.KnowledgeContext.RuleEntities[entity.RuleName] = entity
}

gengine 通过解析器解析规则内容之后，规则的数据结构如下：

全局的 hashmap 以规则名为 key，规则体为 value，规则体中的 ruleContent 为该规则所有的语句表达式列表，列表中的值指向具体的语句表达式实体，语句表达式实体由 逻辑与算术运算、流程控制（IF、FOR）等基本语句组成。

规则语法的执行

其实遍历语法树的过程中，将规则的执行逻辑也放入 ExitXXX() 方法，这样就能一并完成规则的解析和执行。但是 gengine 没有这么做，而是将规则的解析和执行解耦，因为规则的解析往往只需要初始化一次，或者在规则有变更时热更新解析，而规则的执行则是在需要校验规则的时候。

从 gengine 的规则数据结构可知，只需要遍历全局的 hashmap，即可按顺序执行所有的规则（顺序模式），执行每一个规则后会通过addResult()方法记录执行结果：

// 顺序模式
func (g *Gengine) Execute(rb *builder.RuleBuilder, b bool) error {
    for _, r := range rb.Kc.RuleEntities {
        v, err, bx := r.Execute(rb.Dc)
        if bx {
            // 记录每个规则执行结果
            g.addResult(r.RuleName, v)
        }
    }
    // 省略部分
    ...
}

对于某一个规则的执行，则会去遍历规则体 ruleContent 的所有语句表达式列表，然后按顺序去执行该规则下的所有语句表达式：

func (s *Statements) Evaluate(dc *context.DataContext, Vars map[string]reflect.Value) (reflect.Value, error, bool) {
    for _, statement := range s.StatementList {
        v, err, b := statement.Evaluate(dc, Vars)
        if err != nil {
            return reflect.ValueOf(nil), err, false
        }

        if b {
            // return的情况不需要继续执行
            return v, nil, b
        }
    }
    if s.ReturnStatement != nil {
        return s.ReturnStatement.Evaluate(dc, Vars)
    }
    return reflect.ValueOf(nil), nil, false
}

gengine 为每个语句类型都实现了 Evaluate() 方法，这里只讨论 IF 语句的执行：

type IfStmt struct {
    Expression     *Expression
    StatementList  *Statements
    ElseIfStmtList []*ElseIfStmt
    ElseStmt       *ElseStmt
}

func (i *IfStmt) Evaluate(dc *context.DataContext, Vars map[string]reflect.Value) (reflect.Value, error, bool) {
    // 执行条件表达式
    it, err := i.Expression.Evaluate(dc, Vars)
    if err != nil {
        return reflect.ValueOf(nil), err, false
    }
    // 执行条件为真时的语句
    if it.Bool() {
        if i.StatementList == nil {
            return reflect.ValueOf(nil), nil, false
        } else {
            return i.StatementList.Evaluate(dc, Vars)
        }
    }

    return reflect.ValueOf(nil), nil, false
}

其中条件表达式Expression.Evaluate()为计算条件表达式的值：

func (e *Expression) Evaluate(dc *context.DataContext, Vars map[string]reflect.Value) (reflect.Value, error) {
    // 原子表达式
    var atom reflect.Value
    if e.ExpressionAtom != nil {
        evl, err := e.ExpressionAtom.Evaluate(dc, Vars)
        if err != nil {
            return reflect.ValueOf(nil), err
        }
        atom = evl
    }
    
    // 比较操作
    if e.ComparisonOperator != "" {
        // 计算左值
        lv, err := e.ExpressionLeft.Evaluate(dc, Vars)
        if err != nil {
            return reflect.ValueOf(nil), err
        }
        // 计算右值
        rv, err := e.ExpressionRight.Evaluate(dc, Vars)
        if err != nil {
            return reflect.ValueOf(nil), err
        }
        // 省略了类型转化
        switch e.ComparisonOperator {
        case "==":
            b = reflect.ValueOf(lv == rv)
            break
        case "!=":
            b = reflect.ValueOf(lv != rv)
            break
        case ">":
            b = reflect.ValueOf(lv > rv)
            break
        case "<":
            b = reflect.ValueOf(lv < rv)
            break
        case ">=":
            b = reflect.ValueOf(lv >= rv)
            break
        case "<=":
            b = reflect.ValueOf(lv <= rv)
            break
        }
    }
}

递归执行到ExpressionAtom.Evaluate()原子表达式时，就可以得到该原子表达式的值以结束递归：

func (e *ExpressionAtom) Evaluate(dc *context.DataContext, Vars map[string]reflect.Value) (reflect.Value, error) {
    if len(e.Variable) > 0 {
        // 是变量则取变量值，通过反射获取注入的自定义对象值
        return dc.GetValue(Vars, e.Variable)
    } else if e.Constant != nil {
        // 是常量就返回值
        return e.Constant.Evaluate(dc, Vars)
    }
    // 省略部分
}

支持自定义对象注入

在上下文中注入自定义对象后，就可以在规则中使用注入的对象。使用例子：

// 规则体
rule "test-object" "测试自定义对象" salience 10
begin
    // 访问自定义对象Order
    if Order.Price >= 1000000 {
        return
    }
end

// 注入自定义对象Order
dataContext := gctx.NewDataContext()
dataContext.Add("Order", Order)

现在来看下 gengine 的具体实现，主要是使用反射特性：

func (dc *DataContext) Add(key string, obj interface{}) {
    dc.lockBase.Lock()
    defer dc.lockBase.Unlock()
    dc.base[key] = reflect.ValueOf(obj)
}

gengine 解析规则时会将自定义对象标记为variable类型，通过 GetValue() 获取自定义对象属性值：

// 获取变量值
func (dc *DataContext) GetValue(Vars map[string]reflect.Value, variable string) (reflect.Value, error) {
    if strings.Contains(variable, ".") {
        // 对象a.b
        structAndField := strings.Split(variable, ".")
        if len(structAndField) == 2 {
            a := structAndField[0]
            b := structAndField[1]
            // 获取注入的对象
            dc.lockBase.Lock()
            v, ok := dc.base[a]
            dc.lockBase.Unlock()
            if ok {
                return core.GetStructAttributeValue(v, b)
            }
        }
    }
}

// 反射获取对象属性值
func GetStructAttributeValue(obj reflect.Value, fieldName string) (reflect.Value, error) {
    stru := obj
    var attrVal reflect.Value
    if stru.Kind() == reflect.Ptr {
        attrVal = stru.Elem().FieldByName(fieldName)
    } else {
        attrVal = stru.FieldByName(fieldName)
    }
    return attrVal, nil
}

支持自定义方法注入

同样在上下文中注入自定义方法后，也可以在规则中使用注入的方法。使用例子：

// 规则体
rule "test-func" "测试自定义方法" salience 10
begin
    // 自定义方法GetCount获取指标数据（患者当天的订单数量）
    num = GetCount("order-patient-id", Order.PatientId)
    if num >= 5 {
        return
    }
end

// 注入自定义方法GetCount
dataSvc := s.indicatorDao.NewDataService(ctx)
dataContext := gctx.NewDataContext()
dataContext.Add("GetCount", dataSvc.GetCount)

gengine 自定义方法的注入也是使用反射来实现，自定义方法的注入同自定义对象一样也是使用 Add() 方法注入。

gengine 解析规则时会将自定义方法标记为functionCall类型：

func (dc *DataContext) ExecFunc(Vars map[string]reflect.Value, funcName string, parameters []reflect.Value) (reflect.Value, error) {
    // 获取注入的方法
    dc.lockBase.Lock()
    v, ok := dc.base[funcName]
    dc.lockBase.Unlock()
    if ok {
        args := core.ParamsTypeChange(v, parameters)
        // 调用方法
        res := v.Call(args)
        raw, e := core.GetRawTypeValue(res)
        if e != nil {
            return reflect.ValueOf(nil), e
        }
        return raw, nil
    }
}

支持并发执行

通常情况下顺序模式执行即可满足要求，但是当规则数量比较大时，顺序执行的耗时就会比较长。

规则引擎在执行所有规则的时候，其实是遍历全局的 hashmap 然后再顺序执行每一个规则，由于每个规则之间没有依赖关系，因此可以用每一个规则一个协程来并发执行。

func (g *Gengine) ExecuteConcurrent(rb *builder.RuleBuilder) error {
    var wg sync.WaitGroup
    wg.Add(len(rb.Kc.RuleEntities))
    for _, r := range rb.Kc.RuleEntities {
        rr := r
        // 协程并发
        go func() {
            v, e, bx := rr.Execute(rb.Dc)
            if bx {
                g.addResult(rr.RuleName, v)
            }
            wg.Done()
        }()
    }
    wg.Wait()
    // 省略部分
}

使用场景

有了规则引擎之后，很多在业务代码中的 if-else、switch 硬编码，都能抽象为规则并使用规则引擎，这样能通过配置规则代替硬编码，能极大地缩短变更上线时间。

业务风控

通过业务数据分析，可以抽象出用户异常行为的规则：

然后，风控系统在判断是否为风险操作时，只需要规则引擎加载并执行风控规则，即可得到结果。
想要提高风控系统的准确性，只需要不断地迭代完善风控规则。

规则引擎在业务风控的实践，可以参考基于准实时规则引擎的业务风控实践。

运营活动

拿最常见的抽奖和做任务 2 种运营活动来说，都可以将具体活动逻辑抽象为业务规则：
① 抽奖，不同的人&不同的场景对应不同的奖池（中奖概率与奖品集合规则）；
② 做任务，任务领取规则、任务完成指标动态可配（任务规则）；

内容分发

针对某些特定的用户或者某种场景的用户，下发特定的展示内容或者推送短信等触达消息，都可以将这些特定用户的逻辑梳理为内容分发规则。

千人千面个性化推荐系统

2023-01-02T06:00:00.000Z

千人千面是指系统基于用户的兴趣，通过复杂算法来推荐个性化的内容，不再是千篇一律，达到用户所见即所需的效果，能显著提高成交转化率，更能提升用户体验。

关键词

千人千面
个性化推荐
内容系统
算法

发展历程

目前我们日常使用互联网应用几乎都应用了个性化推荐技术，但是它的推广应用却不是一蹴而就的。

第一阶段
2012年今日头条上线，第一个利用推荐系统进行流量分发的内容APP
第二阶段
2015年淘宝双11全面开启“千人千面”时代
现在
知乎、抖音、美团等各大应用都在使用推荐系统进行个性化内容推荐

商业价值

提升用户体验

所见即所需，不再需要用户从成千上万的内容中去挑选自己感兴趣的。

提高成交转化率

精准推广，用户成交冲动更强。

解决方案介绍

应用场景举例

搜索列表

淘宝搜索商品
关键字搜索，并根据相似度排序来推荐相似的商品。

美团外卖搜索
关键字搜索，并根据商家距离、评分、配送速度等因素来综合排序推荐。

信息流
知乎首页信息流，推荐有浏览、赞同、评价的同类内容，以及关注的人的内容，曾发表过的文章有相同主题的内容。

猜你喜欢
推荐用户购买过、浏览过商品的同类商品，还可以推荐对相同商品有相同行为的这类用户的购买和浏览商品。

技术路线

因为推荐系统整个的技术难度较大，一般都是算法专业且有经验的团队来做。实践中可以分3个阶段来做：千人几面——千人百面——千人千面

萌芽：千人几面
基于规则匹配推荐。制定一些简单的业务规则，如根据用户自己对内容产生的浏览次数（看了又看）、购买次数（买了还买），收藏次数来做简单的推荐；或者根据性别年龄分类来做推荐，18岁的女生都喜欢什么，中年大叔又都喜欢什么。

起步：千人百面
基于内容的推荐。如果只是推荐用户已经产生行为的内容，那这些内容也只会是单一的，对用户吸引性不强。那么我们可以基于用户产生行为的这些内容做相似推荐，如推荐相同分类、品牌、标签的内容。

绽芒：千人千面，比你自己更懂你
基于协同过滤的推荐。基于内容的推荐已经能基本满足用户的推荐需求，却不能做到真正的千人千面，因为都是基于用户自己的行为数据来做推荐。

协同过滤不单单只根据自己的喜好，而且还引入了相同行为的人的喜好来进行推荐，即我喜欢的内容，他也喜欢，那么他喜欢的其他内容我可能也很喜欢。以人类人这样推荐更加充分，而且可以深入挖掘用户潜在的兴趣。

那怎么计算内容相似度呢？
首先提取出内容的特征，又通计算得出了用户喜欢的特征，那么可以通过余弦相似度计算出内容间的相似度，做为个性化推荐的依据。余弦相似度是指通过计算两个向量的夹角余弦值来评估他们的相似度，夹角越小，两个向量越相似；夹角越大，两个向量越不同。

我们的机会

业务场景

药房与药品列表
能直接猜出用户所需的药品，而不是简单配一些常见药。

医生列表
对于一个肝病患者展示这些，患者也只能再去搜医生的名字或者科室才能找到医生。

学术文章信息流
医生很忙，不能推些他不感兴趣的学术内容打扰他。

Flink在用户画像上的应用

2022-12-23T11:00:00.000Z

将 Flink 应用于用户画像的场景，既能轻松应对大量的计算量，也能提供实时的计算结果，还能避免开发同学用编程的方式开发数据清洗任务。

关键词

大数据计算
SQL

痛点

解决计算海量数据计算量大、延迟高的性能问题，如用户画像需要计算大量业务和事件数据的场景。

商业价值

数据即价值

对平台积累的大量数据进行挖掘分析，创造出潜在的商业价值。

概述

什么是 Flink

Flink 是一个分布式计算引擎，可以用来做批处理，即处理历史数据；也可以用来做流处理，即实时地处理数据流，并实时地产生数据的结果。

Flink 特点：

性能突出：计算量大-百亿级、延迟低-秒级
支持 SQL 作业：只需要写 SQL 逻辑，简单上手快
有状态支持容错：即发生了失败，也不会丢失、多计算或者少计算

Flink 支持丰富的数据源，能满足大部分的业务场景需求。数据输入源支持 MySQL、Mongo 等数据库，也支持 Kafka 等事件消息中心；数据输出源支持 MySQL、Mongo、Redis 等数据库，也支持 Hbase、Hive 等数据仓库。

当前行业现状

Flink 已成为了大数据计算引擎的首选，国内各大厂都有相应的落地实践案例，技术比较成熟。各云厂商也都提供了相应的云计算产品：

腾讯云：Oceanus
阿里云：Flink

解决方案介绍

Flink 怎样接入

Flink 数据输入端接入 MySQL 数据库和 Kafka 消息中心，能同时对业务数据和业务事件 2 种数据类型进行处理。
Flink 计算输出结果一般存储在 Hive、Hbase 等大数据数仓。因此，接入已有系统数据源并不需要做任何改造。

SQL 作业使用

数据的计算逻辑任务，一般都会选择 SQL 作业的类型。
对开发者友好，只需要用 SQL 表达出对应逻辑即可。

我们的机会

业务场景

用户画像

如图所示，交易数据、处方数据、用户基础数据、用户行为数据作为数据源，经过大数据 Flink 计算清洗、结构化、预处理后，产出疾病特征、基本属性、行为特征画像数据。

借助于 Flink，这一切只需要编写 SQL 即可，数据的处理、分布式调度我们都不需要关心。

基于准实时规则引擎的业务风控实践

2022-06-28T12:00:00.000Z

在当今复杂的互联网环境下，我们的系统时时刻刻都暴露在风险（刷单党、羊毛党）的攻击之中，如果我们不采取有效防御措施，那么这些风险就会对业务造成很大的损失。

用公式可以表达出风控规则和风险数据的系统关系：z=f(x, y)，f 为系统风控规则，x 为系统实时输入风险数据，y 为系统的事实数据。

挑战性

数据量大，计算延时严重
风控策略多变

目标

准确及时识别风险
采取有效防御措施

总体架构

基于大数据实时计算和可热更新的通用规则引擎，搭建一套业务风控系统。

业务风险：刷单（订单）、薅羊毛（活动）、恶意注册和异常登录（用户）

业务服务：

风控系统：识别业务风险，根据业务数据或埋点信息来判断当前用户或事件有无风险；
惩罚系统：对系统风险操作进行控制或惩罚，如禁止下单、增加验证码、限制登录等；
分析系统（管理系统）：提供系统管理和数据展示分析。系统管理如规则管理，分析业务数据如风险的订单，分析系统指标数据如某策略规则拦截率，以及时修正策略规则；

系统引擎：

规则引擎：策略规则的解析和执行，选用 B 站开源的 gengine 规则引擎（golang）；
大数据计算引擎：实时在线或离线计算业务指标数据，选用 Flink + Kafka 流计算引擎，指标数据存储在 Redis（数据异构）。各云厂商提供相应服务，如腾讯云流计算 Oceanus；

消息中心：各系统之间通过事件驱动，选用 Kafka

存储：

MySQL：风控规则等
Redis：指标数据
Mongo：操作日志、快照等

系统工作流程

包含 3 个数据流。

实时风控数据流：由红线标识。业务同步调用风控系统，返回风险识别结果，并作相应惩罚，为系统核心链路；
准实时指标数据流：由蓝线标识。大数据计算引擎实时异步写入，准备业务指标数据并存储在 Redis，为系统准实时链路；
准实时/离线分析数据流：由绿线标识。异步写入，生成业务报表和评估风控系统表现的数据，以供进行数据分析；

风控规则抽象

风控规则通常分 2 种，即统计规则和主体属性规则。都可以抽象为通用公式：

统计规则：{某时间段}，{某主体} 在 {某个统计维度的结果} {比较操作符} {阈值}
主体属性规则：{主体}.{属性名}

下文将以 1天内同一患者ID订单数超过5笔 规则进行示例和说明。

大数据实时计算引擎

Flink 输入数据为 JSON 格式，Flink 的数据源有 2 种：

业务事件 -> Kafka -> Flink，业务事件需要转化为 JSON 消息格式
业务数据 -> DTS -> Kafka -> Flink，支持全量和增量读取数据

数据指标存储

指标数据异构，用空间换时间。Redis 的 zset 结构，通过 ZCOUNT key startTime endTime 操作即可统计任意时间段 startTime 至 endTime 内的统计需求。

规则	实现	写操作	读操作
1天内同一患者ID订单数超过5笔	key：患者id value：订单id score：下单时间	ZADD O(M*log(N)	ZCOUNT O(log(N)+M)

形如 1天内同一患者ID订单数超过5笔 规则，数据指标存储格式：

risk:order-patient-id:123456
|--111111        1652929153
|--222222        1652932753
|--333333        1652939953

统计指标为：

// startTime 和 endTime 对应为1天时间间隔
ZCOUNT risk:order-patient-id:123456 1652940185 1652853785
3

随着时间的推移，zset 会出现元素越来越多的情况，后续可以通过定期升级 key 版本号的方式来解决，每次升级版本号之后需要批处理初始化所有指标数据。

创建指标数据实时计算作业

选用 Flink 的 SQL 作业类型，见创建 SQL 作业。
形如 1天内同一患者ID订单数超过5笔 规则，定义源表和目标表是为了 SQL 中方便使用。

数据源表

定义 MySQL 数据源表，字段跟数据表一一对应映射。

CREATE TABLE `risk_input_order` (
    `id`            INT,
    `pid`           INT,
    `doctor_id`     INT,
    `patient_id`    INT,
    `deliver_phone` VARCHAR(20),
    `deliver_name`  VARCHAR(20),
    `delivery_address` VARCHAR(200),
    `prescription_id`  INT,
    `total_price`      INT,
    `is_test`          TINYINT,
    `created_at`       TIMESTAMP
) WITH (
    -- 定义 Kafka 参数
    'connector' = 'kafka',
    'topic' = 'med_dts_b_convert',  -- 消费的 Topic
    'scan.startup.mode' = 'latest-offset', -- 可以是 latest-offset / earliest-offset / specific-offsets / group-offsets / timestamp 的任何一种
    'properties.bootstrap.servers' = '172.28.28.13:9092',  -- Kafka 连接地址
    'properties.group.id' = 'risk_input_order',            -- 指定 Group ID

    -- 定义数据格式 (JSON 格式)
    'format' = 'json',
    'json.fail-on-missing-field' = 'false',  -- 遇到缺失字段不会报错
    'json.ignore-parse-errors' = 'true'      -- 忽略任何解析报错
);

目标表

定义 Redis 目标表，对应 ZADD key value score 操作写入数据。

CREATE TABLE `risk_output_order_patient_id` (  
    `key`   STRING,
    `value` STRING
    `score` DOUBLE
) WITH (
    'connector' = 'redis',          
    'command' = 'zadd',              -- redis zadd命令写入数据
    'nodes' = '192.28.28.217:6379',  -- redis连接地址。
    'password' = 'yourpassword'   
);

数据计算逻辑

直接使用 SQL 来清洗和合并数据。

-- 清洗患者id维度订单数据
INSERT INTO risk_output_order_patient_id
SELECT
CONCAT('risk:order-patient-id:', patient_id) AS `key`,
id AS value,
UNIX_TIMESTAMP(created_at) AS score
FROM risk_input_order
WHERE pid = 0;

流批一体（流处理和批处理一套逻辑）

在首次初始化指标数据或者新增数据指标的场景下，需要支持读取全量和增量数据，流批一体后，这样无需维护两套流程。

源表数据过期时间

其实要做到流批一体，只需要 Flink 源表历史数据的过期时间不小于指标数据统计周期即可。系统 Kafka 消息过期时间增大为 30 天，则指标数据统计周期最大也为 30 天（已经满足风控规则要求），因此系统是可以做到流批一体的。

初始化和新增指标数据

因为在风控场景，规则中的指标数据只需要最近统计周期时间的数据，可以直接重置 Kafka 消息位点来批处理源表历史数据，即可清洗出对应的指标数据。

CREATE TABLE `risk_input_order` (
) WITH (
    -- 定义 Kafka 参数
    'connector' = 'kafka',
    'scan.startup.mode' = 'earliest-offset', -- 最早消费位点
);

风控系统

封装规则引擎形成 risk-service 服务，供业务直接调用。
风险识别流程：

接口

对外提供业务风险识别接口、业务数据或事件上报接口。

// 订单风控
service RiskOrder {
    // 风险识别
    rpc CheckRisk (CheckRiskReq) returns (CheckRiskResp);
    // 数据/事件上报
    rpc Report (ReportReq) returns (ReportResp);
}

规则引擎

很多的规则形成规则集，规则集组成一颗决策树，决策树是规则引擎核心的判断逻辑。

规则体语法

是一种自定义的 DSL 语法。支持运算符、支持基础数据类型、支持条件语句、支持并发语句块、并支持结构体和方法注入。

// 规则名必须唯一
rule "rulename" "rule-describtion" salience priority
begin

//规则体

end

形如 一天内同一患者ID订单数超过5笔 规则，规则体语法为：

rule "pa-daily-order-count" "一天内同一患者ID订单数规则" salience 10
begin
if GetData("order-patient-id", Patient.UserId, 24*3600) > 5 {
    return // 命中规则
}
end

获取事实和指标数据

通过对规则引擎注入预定义的结构体和方法，可以实现在规则体中获取事实和指标数据。

事实数据
对规则引擎注入 User、Patient 结构体引用(指针)，在规则体中通过 {主体}.{属性} 的方式即可获取到事实的某个属性。

// 获取事实数据
user := xuser.GetUserInfo(userId)
patient := xuser.GetPatientInfo(userId)

dataContext := context.NewDataContext()
// 事实数据注入
dataContext.Add("User", user)
dataContext.Add("Patient", patient)

指标数据
对规则引擎注入 GetData() 方法，参数是一个三元组，在规则体中通过 GetData(“指标名”, “主体id”, “时间周期”) 的方式即可获得指标数据。

// 获取指标数据函数
func (s *DataService) GetData(indicator string, subjectId string, period int64) int64 {
    key := fmt.sprintf("risk:%s:%s", indicator, subjectId)
    endTime := time.Now().Unix()
    startTime := endTime - period
    
    err, res := redis.SCount(key, startTime, endTime)
    if err != nil {
        // 注入函数会忽略 error 返回值，通过错误标志来区分报错和默认值的情况
        s.SetError(err)
        return 0
    }

    return res
}

// 函数注入规则引擎
dataContext := context.NewDataContext()
dataSvc := &DataService{}
dataContext.Add("GetData", dataSvc.GetData)

执行模式

支持并行模式和混合模式执行，目前只考虑并行模式。

规则编译与执行

dataContext := context.NewDataContext()
// 数据、函数注入

var rules []string
// rules from MySQL...

// 规则编译
ruleBuilder := builder.NewRuleBuilder(dataContext)
for _, r := range rules {
    if err := ruleBuilder.BuildRuleWithIncremental(r); nil != err {
        return err
    }
}

// 规则并行模式执行
eng := engine.NewGengine()
if err := eng.ExecuteConcurrent(ruleBuilder); nil != err {
    return err
}
if dataSvc.HasError() {
    // 规则执行过程中，获取数据发生的报错
    return dataSvc.FirstError()
}

// 执行结果 map[命中规则ID]interface{}
resMap, _ := eng.GetRulesResultMap()

管理系统

管理系统包含惩罚系统和分析系统。系统功能如下：

怎样发布一个规则

一个完整的风控规则发布流程：

研发工程师可以在管理后台很方便地编写规则，并支持版本管理：

怎样接入一个新的业务风险

只需要做 2 件事：

生成业务指标数据
配置业务风控规则

系统降级

因为业务系统会同步调用风控系统进行风险识别，如果风控系统不可用时，则业务系统也不可用，因此需要系统降级措施。

关闭场景开关
紧急情况可关闭场景开关，业务风险识别接口则直接返回无风险。

2021年终总结

2021-12-31T13:00:00.000Z

关键词：不轴

这一年信息量还是挺大，做了很多项目，但是业务产出较少（有一些外部因素），职级也未能得到晋升。经过这一年的时间沉淀，不再自以为是，以更开放的心态接受身边事物的改变。

业务

业务第一

不再以为技术最牛逼，更多考虑的是用户体验，跟产品撕逼的情况少了，愿意去提供更好的方案，更会站在产品的角度去懂得产品同学的想法。业务第一，产品第二，技术第三，技术赋能产品，产品驱动业务，一切都是为了业务。

最近有一个业务需求，需求前期阶段就同产品同学对接过几次，确定了可行方案。但是到了需求评审阶段，又进行了多次修改调整，需求评审时间跨度1周+，这就导致剩余给开发和测试的时间只有 1 周了。项目参与同学怨声载道，不满情绪较多。
这时我就陷入了两难境地，为了让项目参与同学解气也一起喷产品同学（你这需求能不能行了），还是试图让项目同学理解这种特殊情况（项目同学：理解个屁啊，开发时间这么短，谁能理解我啊，到时候上不了线又说技术同学不给力）？
我是项目技术 Owner，要解决这种僵局需要多做少说，解释就是掩饰，只能想办法解决需求变更的原因。先拉上产品同学从技术视角提供可行的解决方案，从用户视角优化流程体验，确定最终的产品核心流程链路，这些一期先上线不能再变动。
其他的统统放后续优化迭代，在一期上线之后再处理。

技术重构

这一年在上游产品输出一般的情况下，我们抽了大部分时间做了系统重构，填了很多坑（也又埋了一些坑），业务完成了收口，也为后续业务迭代打好基础。超过 85% 的业务已完成系统重构，2 个重构项目获得了标杆 OKR。

怎么选定重构项目？

从实际出发，是业务或开发痛点的才去重构，不要为了重构而重构。

历史包袱重且迭代频繁的核心业务功能
迭代频繁可抽象通用化的功能
迭代频繁可配置化的功能

怎么实施重构？

不着急大步推进重构，拆分成不同的迭代周期，每期的任务是具体的，是可以完成，是进度可控的。另外找到合适的时间点去做重构，借力合适的业务需求去做重构，就会事半功倍。

合适的时间点去做重构，有这样一个例子：
由于历史原因，我们有个问诊系统，对接了百度、腾讯且各自为独立系统，算上我们自己的系统有 3 套类似功能的系统，在 APP 端也是不同的功能流程。这样用户体验不好，开发维护体验也不好。
之前我们团队一直在小步重构自己的这套系统（功能已兼容其他 2 套系统），而其他2套对接三方的系统重构优先级放的比较低。
直到有一天，业务团队说三方对接业务暂停了，借此时机我们快速推进了问诊系统重构，把 APP 端的功能统一为一个流程了。

重构过程中，我比较关注怎么为以后的开发提效：

功能复用，减少重复开发
配置化，不需要开发和发版

重构后有什么收获？

人员更熟悉业务了
之前由于人员流动，部分新同学进来，加上业务文档缺失，短期没人熟悉业务，导致问题频出。重构前，会先梳理出业务文档和技术方案，有了文档沉淀。重构后，团队参与重构的同学也熟悉业务了。
历史包袱少了
历史代码逻辑本来就设计不合理，因为逻辑混乱再加上后续的迭代修改，没人看得懂也没人敢优化逻辑，就成了一堆祖传代码（屎山）。后续修改维护都需要花大量时间梳理逻辑找到需要修改的点，另任何修改都需要测试全面覆盖用例。
系统更合理更可扩展了
举一个例子，诊室 IM 按钮的配置化改造后，后端可以直接配置下发。

{
    "name": "@",      // 按钮名称
    "menuType": 1,    // 按钮类型
    "url": "",        // 按钮跳转scheme
    "apiAddress": "", // 按钮点击触发接口
    "tag": null       // 按钮角标
}

95% 情况的修改不需要 APP 发版。前几天，公司 CTO 觉得现在的按钮顺序不太合理，找到我想要调整一下，我当时心里窃喜，还好我们已经提前做了配置化改造，不然就要被喷了。
可以配置化后，很快就完成了按钮顺序调整。这件事也让我更体会到技术手段的重要性，之前 Native 开发按钮，也不是不可用，只是不够灵活，任何修改需要发版，关键时刻救不了火。

团队

每个人都是某块业务的 Owner，协作起来比较顺畅，执行力比较强（自我感觉）。

拥抱变化

公司经历了几次组织架构调整，团队人员有进有出，也以开放的心态拥抱这种变化，因为唯一不变的就是变化。
最近一次组织架构调整，原本团队 20 人左右（包括 Native），对 APP 终端的业务功能负责。这次调整，我把 Native 交给了一个比我更合适的同事。
其一，我后端出身，对 Native 技术不熟悉，属于外行管内行的情况，可能由于我这方面的短视，无法提供更有建设性的意见，对这些同学的发展不利；其二，在团队内也没有找到合适的同学来补位。

但是我还是挺感谢这一段时间经历，对我来说是一个跨界，接触到了之前没关注的领域，拓展了自己的技术视野，会全局考虑技术实现方案，对后续工作也是很有帮助。
比如之前后端在设计技术方案的时候不会考虑 Native 这边，出现过 1 个页面需要调用 20 多个接口的情况（Native 同学咋没原则，不知道拒绝），Native 代码里也充斥着大量的业务逻辑实现。对此后续在团队里面形成规定：

接口要收敛
业务逻辑收口到后端，前端只做展示和交互逻辑

充分信任

相信团队的每一个人，不再觉得只有自己能做。把一些事授权给团队成员去做，对他们才会有更多成长机会。

充分信任。疑人不用，用人不疑
授权指导。明确任务、时间、验收标准，以及如果是我大概会去怎么做
监督。正向反馈，即时修偏
拿结果。做得怎么样，问题复盘改进

寻找关键人

以点带面，良币驱逐劣币。抓好团队这些关键人，让他们经历更多事情的蹂躏快速成长起来，负责更多的事，担更多的责任，避免团队因我这个单点而导致的翻车。

个人

新的角色

加入了后端技术委员会，能为团队做更多的事，面对更有挑战的一些技术难题。

以下 2 个案例都是为了解决团队发版日必过凌晨的问题，团队发布效率低导致加班严重。

发布流水线

微服务化之后，稍微大一点的项目发布都会有 10+ 的应用，之前全是人工手动到发布平台上一个一个应用点发布，效率低，且容易出现发布遗漏应用的情况。
另外如果是多个项目发布，那么就需要排队等待，后面发布的项目就遭殃了。

有段时间我深受其害，想办法解决这种情况。刚好质效部门有个同学有些想法，于是我俩来回拉扯了几次，确定了发布流水线大概功能：每个迭代需求系统自动生成发布清单，
多个迭代可以合并发布，支持一键部署完成代码合并和应用发布。这哥们也是给力，过了一段时间就做好上线了，当然我们部门也就成了第一个吃螃蟹的人。效果很明显，后续发布效率提高了很多。

预发布环境

之前工程部门已经搞过一次，但是没有落地成功。一是方案不是很合理；二是需要对接的业务团队较多，协调困难；三是没有做到开箱即用（工程部只管搭好环境，预发环境的应用还需要业务团队自己部署）。

基于之前的教训，我先是设计出整体实施方案，并得到了技术委员会的通过，然后拉上各业务线技术负责人，告知背景并需要得到资源支持（1 个人就好，小部分应用需要做一点小改造），最后我就拉上运维开始实施，搭建环境并批量部署应用。
预发环境搭建好之后，白天可以在预发环境（真实的数据一致的环境）测试验收，因为降低了发布风险所以可以提前发布生产了，后续发布到很晚的情况就更少了。

时间怎么分配

负责的业务更多了，大部分事情都会先到我这里。可一天时间就这么多（995 又咋样），怎么办？搬出我的时间四象限：

明年TODO

能负责 1 个新产品落地，从 0 到 1 更需要系统设计，更有挑战，也更有成就感
跟其他团队合作更多，认识更多的人，发现更多的团队问题
个人职级晋升，负责更多的事，担更多的责任（背更多的锅）
养成读书习惯，复制行业榜样的经验

职场即战场，很残酷很现实，需要实力和运气，如果当前的情况左右不了，就随它去吧，先丰富自己。

使用Docker轻松部署Hexo博客系统

2020-12-27T06:00:00.000Z

我的博客停服已经有几个月了，主要原因是使用的 Google Cloud 免费服务器已经到期了，而整个博客系统的迁移成本很大，因此迟迟没有开启服务。

这周末，终于有时间来彻底解决博客迁移问题了。通过改造 Hexo 博客系统，使其支持 Docker 部署，彻底摆脱了运行环境依赖，以后再更换云服务器厂商时，就可以做到快速平滑迁移了。

我的博客做过定制化改造，使用的是 hexo-theme-yilia 作为主题，评论使用的是 disqus-php-api，支持 HTTPS 协议，因此本次改造主要涉及这些。

Docker 环境

云服务器

由于没有了 Google Cloud 的免费使用资格，只能在国内挑选较便宜的腾讯云云服务器厂商，购买了一台低配云服务器。

这台服务器的操作系统是 CentOS，我们选用 Docker Compose 作为容器编排工具。

安装 Docker

# 1.删除旧的Docker版本
sudo yum remove docker \
                  docker-client \
                  docker-client-latest \
                  docker-common \
                  docker-latest \
                  docker-latest-logrotate \
                  docker-logrotate \
                  docker-engine

# 2.添加Docker源
sudo yum install -y yum-utils
sudo yum-config-manager \
    --add-repo \
    https://download.docker.com/linux/centos/docker-ce.repo

# 3.安装Docker
sudo yum install docker-ce docker-ce-cli containerd.io
sudo yum install docker-ce-20.10.1 docker-ce-cli-20.10.1 containerd.io

# 4.启动Docker
sudo systemctl start docker

# 5.查看Docker版本
docker -v
Docker version 20.10.1, build 831ebea

安装 Docker Compose

# 1.获取docker-compose脚本
sudo curl -L "https://github.com/docker/compose/releases/download/1.27.4/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose

# 2.增加可执行权限
sudo chmod +x /usr/local/bin/docker-compose
sudo ln -s /usr/local/bin/docker-compose /usr/bin/docker-compose

# 3.查看版本
docker-compose --version
docker-compose version 1.27.4, build 40524192

项目改造

调整目录结构

之前的目录结构较为单一，需调整项目目录结构。调整后的目录结构如下：

├── _config.yml           # Hexo配置文件
├── disqus                # Disqus评论
├── themes                # Hexo主题
│   └── yilia             # hexo-theme-yilia主题
├── source                # 文章.md文件
├── public                # Hexo发布后的静态资源文件
├── dockerfiles           # Dockerfile文件
│   ├── nginx
│   ├── nodejs
│   └── php
├── docker-compose.yml    # 容器编排配置
├── docker.env            # Docker环境变量文件
├── docker.example.env    # Docker环境变量示例文件
├── network-override.yml  # 容器编排配置（特殊网络）
└── package.json          # Hexo依赖包

其中，disqus 和 yilia 目录分别对应 disqus-php-api 和 hexo-theme-yilia 这 2 个子项目，并采用 submodule 模式管理这些源代码。

在 submodule 模式下，clone 和 pull 命令会有一些变化，分别为 git clone --recursive https://github.com/fan-haobai/blog.git
和 git pull && git submodule foreach git pull origin master。

编排容器

本博客系统，主要依赖 NodeJS、PHP、Nginx 环境，因此分别构建 3 个容器。

配置 docker-compose.yml

Docker Compose 会根据 docker-compose.yml 配置文件，来自动编排容器。配置如下：

version: '3'
services:
  nginx:
    restart: always
    build: ./dockerfiles/nginx
    ports:
      - "80:80"
      - "443:443"
    volumes:
      # 博客源代码
      - "/var/www/blog:/var/www/blog"
      # HTTPS证书
      - "/var/www/ssl/certs:/var/www/ssl/certs"
      # Nginx配置
      - "$PWD/dockerfiles/nginx/conf.d:/etc/nginx/conf.d"
    command: /bin/bash /start.sh
    env_file:
      - docker.env
    extra_hosts:
      - "raw.githubusercontent.com:199.232.96.133"
    container_name: "nginx"
  nodejs:
    build: ./dockerfiles/nodejs
    ports:
      - "4000:4000"
    volumes:
      - "/var/www/blog:/var/www/blog"
    container_name: "nodejs"
  php:
    restart: always
    build: ./dockerfiles/php
    expose:
      - "9000"
    volumes:
      - "/var/www/blog:/var/www/blog"
    container_name: "php"

其中，services 下为需要编排的 nodejs、php、nginx 容器服务。每个容器服务都可以灵活配置，常见的配置参数如下：

restart：容器退出时，是否重启
build：构建容器 Dockerfile 文件所在的目录
ports：映射端口
volumes：挂载目录
command：容器启动后执行的命令
env_file：环境变量文件
extra_hosts：域名IP映射
container_name：容器名称

Docker Compose 支持多配置文件，且为覆盖关系。因此将 ssl-override.yml 作为获取 HTTPS 证书时启动容器的配置文件。

配置 docker.env

环境变量统一配置在 docker.env 文件中，并增加示例环境文件 docker.example.env。环境变量目前较少，如下：

# 是否启用HTTPS证书
ENABLE_SSL=true

# 支持HTTPS协议的域名
SSL_DOMAINS=fanhaobai.com,www.fanhaobai.com

构建 Dockerfile

Dockerfile 文件统一放在 dockerfiles 目录下，并分别建立 nodejs、php、nginx 文件夹。

NodeJS

该容器下需要安装 git、npm。Dockerfile 文件如下：

FROM node:12-alpine

RUN echo "Asia/Shanghai" > /etc/timezone \
    && echo "https://mirrors.ustc.edu.cn/alpine/v3.9/main/" > /etc/apk/repositories  \
    && npm config set registry https://registry.npm.taobao.org \
    && apk add --no-cache git \
    && npm install hexo-cli -g

ADD *.sh /
RUN chmod 777 /*.sh

EXPOSE 4000

ENTRYPOINT ["sh", "/start.sh"]

其中，start.sh 为容器的启动脚本，主要作用为生成静态资源文件。内容如下：

#!/bin/bash

cd /var/www/blog

# 更新代码
git pull && git submodule foreach git pull origin master

# 生成静态资源
npm install --force
# hexo clean
hexo g
hexo s

PHP

该容器基于官方的基础镜像，安装一些必要的扩展。Dockerfile 文件如下：

FROM php:7.3.7-fpm-alpine3.9

RUN echo 'https://mirrors.aliyun.com/alpine/v3.9/main/' > /etc/apk/repositories && \
    echo 'https://mirrors.aliyun.com/alpine/v3.9/community/' >> /etc/apk/repositories

# 安装扩展
RUN apk add --no-cache $PHPIZE_DEPS \
    && apk add --no-cache libstdc++ libzip-dev vim\
    && apk update \
    && apk del $PHPIZE_DEPS
RUN apk add --no-cache freetype libpng libjpeg-turbo freetype-dev libpng-dev libjpeg-turbo-dev \
    && apk update \
    && docker-php-ext-configure gd --with-freetype-dir=/usr/include/ --with-jpeg-dir=/usr/include/ --with-png-dir=/usr/include/ \
    && docker-php-ext-install -j$(nproc) gd \
    && docker-php-ext-install -j$(nproc) opcache \
    && docker-php-ext-install -j$(nproc) bcmath

# 配置文件
RUN mv "$PHP_INI_DIR/php.ini-production" "$PHP_INI_DIR/php.ini"
ADD conf.d/* $PHP_INI_DIR/conf.d/

其中，conf.d 下为 php 的配置文件。

Nginx

Dockerfile 文件

该容器基于官方的基础镜像，并安装 cron、wget、python。Dockerfile 文件如下：

FROM nginx:latest

# 安装cron等
RUN sed -i s@/deb.debian.org/@/mirrors.aliyun.com/@g /etc/apt/sources.list \
    && apt-get update && apt-get install -y cron wget python

# 启动脚本和配置
ADD *.sh /
ADD nginx.conf /etc/nginx/nginx.conf

# HTTPS证书生成脚本
ADD ssl/* /var/www/ssl/
RUN chmod +x /var/www/ssl/*.sh

RUN chmod 777 -R /var/log/nginx

其中，conf.d 下为 nginx 的配置文件，ssl 下为 HTTPS 证书的生成脚本。

HTTPS 证书生成脚本

ssl 下的 init_ssl.sh 为首次获取 HTTPS 证书脚本，refresh_cert.sh 为更新 HTTPS 证书脚本。

其中，init_ssl.sh 脚本内容如下：

#!/bin/bash

echo "### Stoping nginx ..."
docker-compose down

# 启动容器
echo "### Starting nginx ..."
docker-compose -f docker-compose.yml -f ssl-override.yml up --force-recreate --build -d

# 是否启动完成
until [ "`docker inspect -f {{.State.Running}} nginx`"=="true" ]; do
    echo "### Wait nginx docker start ..."
    sleep 0.1;
done;

# 生成HTTPS证书
echo "### Gen nginx ssl ..."
docker exec nginx /bin/bash /var/www/ssl/refresh_cert.sh

# 重启nginx
echo "### Restart nginx ..."
docker exec nginx nginx -s reload

ssl-override.yml 会覆盖 docker-compose.yml 中的环境变量，因此会将环境变量 ENABLE_SSL 设置为 false，并将 php 解析到 127.0.0.1，以确保 nginx 容器在首次能成功启动。

而 refresh_cert.sh 脚本内容如下：

#!/bin/bash

dir='/var/www/ssl'
certs_dir="$dir/certs"

mkdir -p $certs_dir
cd $certs_dir

if [ -z "$SSL_DOMAINS" ]; then
    echo "### Domains is empty"
    exit 1
fi

echo "### Starting ssl ..."

openssl genrsa 4096 > account.key
openssl genrsa 4096 > domain.key

domains=`echo "DNS:$SSL_DOMAINS" | sed 's/,/&DNS:/g'`
echo "### Gen domain key, domains: $domains ..."
openssl req -new -sha256 -key domain.key -subj "/" -reqexts SAN -config \
    <(cat /etc/ssl/openssl.cnf <(printf "[SAN]\nsubjectAltName=$domains")) > domain.csr

echo "### Download acme_tiny script ..."
wget https://raw.githubusercontent.com/diafygi/acme-tiny/master/acme_tiny.py -O acme_tiny.py

echo "### Gen chained cert ..."
python acme_tiny.py --account-key account.key --csr domain.csr --acme-dir $dir/challenges/ > signed.crt || exit
openssl dhparam -out dhparams.pem 2048
wget -O - https://letsencrypt.org/certs/lets-encrypt-x3-cross-signed.pem > intermediate.pem
cat signed.crt intermediate.pem > chained.pem

echo "### End ssl ..."

其中，SSL_DOMAINS 为环境变量文件 docker.env 中配置需要支持 HTTPS 的域名。

容器启动脚本

在该容器启动后，会执行 start.sh 脚本。其内容如下：

#!/bin/bash

dir="/var/www/ssl"
mkdir -p "$dir/challenges"

# 是否启用HTTPS
if [ "$ENABLE_SSL" = "false" ]; then

    # 修改nginx配置, 不启用HTTPS
    sed -i '/https/d' /etc/nginx/nginx.conf
else

    # 每2个月更新一次, 并重启nginx容器
    ssl_cron="0 0 1 */2 * $dir/refresh_cert.sh && nginx -s reload 2>> /var/log/acme_tiny.log"
    crontab -l | { cat; echo "$ssl_cron"; } | crontab -
fi

# 前台启动
nginx -g "daemon off;"

其中需要注意，当不启用 HTTPS 协议时，需要将 Nginx 配置修改为不启用 HTTPS；而启用时，会添加每 2 个月重新生成证书的定时任务。nginx 也需要改为前台启动模式，否则容器会因没有前台程序而自动退出。

部署

前面的一切都准备就绪后，部署就异常简单了，后续再迁移时，也只需要简单做部署这一步就好了。

配置环境变量

cp docker.example.env docker.env

获取HTTPS证书

/bin/bash dockerfiles/nginx/ssl/init_ssl.sh

注意：如果无需支持HTTPS协议，则跳过此步骤，并将环境变量 ENABLE_SSL 修改为 false。

启动所有容器

docker-compose up --force-recreate --build -d

如果一切顺利，那么运行 docker ps -a 命令就能看到已成功启动的容器，如下：

docker ps -a
CONTAINER ID   IMAGE         COMMAND                  CREATED      STATUS      PORTS                    NAMES
b0307bac08d7   blog_nodejs   "sh /start.sh"           2 days ago   Up 2 days   0.0.0.0:4000->4000/tcp   nodejs
e8ef7a1e9271   blog_nginx    "/docker-entrypoint.…"   2 days ago   Up 2 days   0.0.0.0:80->80/tcp       nginx
af7baad788c5   blog_php      "docker-php-entrypoi…"   2 days ago   Up 2 days   9000/tcp                 php

通过 www.fanhaobai.com 域名也可以直接访问到本站了。

使用 webhook-cli 工具可以支持代码自动部署，详细见我的博客发布上线方案 — Hexo。

更新 »

disqus-php-api 已替换为开源的 DisqusJS，无需再单独部署。
博客源码 howborn/blog。

自建一个简易的OpenAPI网关

2020-07-15T11:30:00.000Z

网关（API Gateway）是请求流量的唯一入口，可以适配各类渠道和业务，处理各种协议接入、路由与报文转换、同步异步调用等，来管理 API 接口和进行请求流量控制，在微服务架构中，网关尤为重要。

背景

当然，现在已有很多开源软件，如 Kong、Gravitee、Zuul。

这些开源网关固然功能齐全，但对于我们业务来说，有点太重了，我们有部分定制化需求，为此我们自建了一个轻量级的 OpenAPI 网关，主要供第三方渠道对接使用。

简介

功能特性

接口鉴权

请求 5s 自动过期
参数 md5 签名
模块粒度的权限控制

接口版本控制

支持转发到不同服务
支持转发到同一个服务不同接口

事件回调

事件订阅
最大重试 3 次
重试时间采用衰减策略（30s、60s、180s）

系统架构

从第三方请求 API 链路来说，第三方渠道通过 HTTP 协议请求 OpenAPI 网关，网关再将请求转发到对应的内部服务端口，这些端口层通过 gRPC 调用请求到服务层，处理完请求后依次返回。

从事件回调请求链路来说，服务层通过 HTTP 协议发起事件回调请求到 OpenAPI 网关，并立即返回成功。OpenAPI 网关异步完成第三方渠道事件回调请求。

实现

网关配置

由于网关存在内部服务和第三方渠道配置，更为了实现配置的热更新，我们采用了 ETCD 存储配置，存储格式为 JSON。

配置分类

配置分为以下 3 类：

第三方 AppId 配置
内外 API 映射关系
内部服务地址

配置结构

a、第三方 AppId 配置

b、内部服务地址

c、内外 API 映射关系

配置更新

利用 ETCD 的 watch 监听，可以轻易实现配置的热更新。

当然也还是需要主动拉取配置的情况，如重启服务的时候。

API 接口

第三方调用 API 接口的时序，大致如下：

参数格式

为了简化对接流程，我们统一了 API 接口的请求参数格式。请求方式支持 POST 或者 GET。

接口签名

签名采用 md5 加密方式，算法可描述为：

1、将参数 p、m、a、t、v、ak、secret 的值按顺序拼接，得到字符串；
2、md5 第 1 步的字符串并截取前 16 位，得到新字符串；
3、将第 2 步的字符串转化为小写，即为签名；

PHP 版的请求，如下：

$appId = 'app id';
$appSecret = 'app secret';
$api = 'api method';

// 业务参数
$businessParams = [
  'orderId' => '123123132',
];

$time = time();
$params = [
  'p'  => json_encode($businessParams),
  'm'  => 'inquiry',
  'a'  => $api,
  't'  => $time,
  'v'  => 1,
  'ak' => $appId,
];

$signStr = implode('', array_values($params)) . $appSecret;
$sign = strtolower(substr(md5($signStr), 0, 16));

$params['s'] = $sign;

接口版本控制

不同的接口版本，可以转发请求到不同的服务，或同一个服务的不同接口。

事件回调

通过事件回调机制，第三方可以订阅自己关注的事件。

对接接入

渠道接入

只需要配置第三方 AppId 信息，包括 secret、回调地址、模块权限。

即，需要在 ETCD 执行如下操作：

$ etcdctl set /openapi/app/baidu '{
    "Id": "baidu",
    "Secret": "00cf2dcbf8fb6e73bc8de50a8c64880f",
    "Modules": {
        "inquiry": {
            "module": "inquiry",
            "CallBack": "http://www.baidu.com"
        }
    }
}'

服务接入

a、配置内部服务地址

即，需要在 ETCD 执行如下操作：

$ etcdctl set /openapi/backend/form_openapi '{
    "type": "form",
    "Url": "http://med-ih-openapi.app.svc.cluster.local"
}'

b、配置内外 API 映射关系

同样，需要在 ETCD 执行如下操作：

$ etcdctl set /openapi/api/inquiry/createMedicine.v2 '{
    "Module": "inquiry",
    "Method": "createMedicine",
    "Backend": "form_openapi",
    "ApiParams": {
        "path": "inquiry/medicine-clinic/create"
    }
}'

c、接入事件回调

接入服务也需要按照第三方接入方式，并申请 AppId。回调业务参数约定为：

Golang 版本的接入，如下：

const (
AppId = "__inquiry"
AppSecret = "xxxxxxxxxx"
Version = "1"
)

type CallbackReq struct {
TargetAppId string                 //目标APP Id
Module      string                 //目标模块
Event       string                 //事件
Params      map[string]interface{} //参数
}

func generateData(req CallbackReq) map[string]string {
    params, _ := json.Marshal(req.Params)
p := map[string]interface{}{
"ak": req.TargetAppId,
"m":  req.Module,
"e":  req.Event,
"p":  string(params),
}

pStr, _ := json.Marshal(p)
postParams := map[string]string{
"p":  string(pStr),
"m":  "callback",
"a":  "callback",
"t":  fmt.Sprintf("%d", time.Now().Unix()),
"v":  Version,
"ak": AppId,
}

postParams["s"] = sign(getSignData(postParams) + AppSecret)

return postParams
}

func getSignData(params map[string]string) string {
return strings.Join([]string{params["p"], params["m"], params["a"], params["t"], params["v"], params["ak"]}, "")
}

func sign(str string) string {
return strings.ToLower(utils.Md5(str)[0:16])
}

未来规划

后台支持配置 AppId
事件回调失败请求支持手动重试
请求限流

在分布式系统使用Kafka

2020-05-12T04:30:00.000Z

在分布式系统中，常常使用消息系统进行系统解耦，并实现一些异步业务逻辑，保证系统最终数据一致性。这里主要介绍在实际中落地使用 Kafka 的一些事项。

消息TOPIC

根据不同业务，拆分不同的 Topic。

消息结构

格式定义

推送至 Kafka 的消息统一使用 JSON 结构，数据如：

{
"type": "/StatusEvent",
"data": "XXXXXXXXXX"
}

消息结构定义为：

// 消息事件数据
type PbEventMessage struct {
   // 事件数据类型：包/结构体名
   Type string
   // 事件数据
   Data []byte
}

其中，Type 为消息类型，Type 为消息事件的 PB 结构体名称；Data 为 PB 协议的事件数据，见下文。

由于 PB 只序列化字段类型和顺序，因此同一个 PB 数据流在反序列化时，存在多个类型消息事件解释。而同一个 Topic 会存在多个类型消息事件，只通过 PB 并不能区分消息，因此引入 Type 用来区分不同类型消息。

事件数据

例如，当业务订单状态发生扭转时，会产生订单状态事件消息。

订单状态
message StatusEvent {
    // 订单transNo
    uint64 trans_no = 1;
    // 状态
    uint32 status = 2;
    // 扩展数据
    string ext = 3;
}

业务消费

通过消费 Kafka 消息，实现部分业务逻辑。在实现 Consume 时，需要注意以下几个事项：

1、原则上保持职责单一原则

即不同的业务逻辑要拆分到不同的 Consume 实现。

// Consume PaySms
// 支付短信提醒
type PaySms struct {
   handler.Base
}


func (h PaySms) Handle(msg *cevent.PbEventMessagee) error {
}

// Consume PayWx
// 支付公众号消息通知
type PayWx struct {
   handler.Base
}


func (h PayWx) Handle(msg *cevent.PbEventMessage) error {
}

2、只消费自己关注的 Type 类型消息

// Consume PaySms
type PaySms struct {
   handler.Base
}


func (h PaySms) Handle(msg *cevent.PbEventMessage) error {
   var (
       event = new(StatusEvent)
   )
   
   // 只消费自己关注的 Type 类型消息
   if !msg.Unmarshal(event, msg) {
       return nil
   }


   // 处理逻辑
}


// 事件数据消息
type PbEventMessage struct {
   // 事件数据类型：包/结构体名
   Type string
   // 事件数据
   Data []byte
}

func (msg PbEventMessage) Unmarshal(event PbEvent) error {
   // 事件数据类型校验
   t := utils.FullTypeNameOf(event)
   if msg.Type != t {
      return errors.Errorf("type %s cannot be converted to %s", msg.Type, t)
   }

   // 数据解码
   err := event.XXX_Unmarshal(msg.Data)
   if nil != err {
      return err
   }

   return nil
}

3、消费异常重试机制

消息消费采用至少一次的消费语义，即先消费后保存读取偏移量。若消费失败，则不更新读取偏移量，会继续消费该失败消息。

// 实现 ConsumerGroupHandler 接口
type defaultConsumer struct {
   handler cevent.Handler
}


func (c *defaultConsumer) Setup(sarama.ConsumerGroupSession) error {
   return nil
}

func (c *defaultConsumer) Cleanup(sarama.ConsumerGroupSession) error {
   return nil
}

// ConsumeClaim must start a consumer loop of ConsumerGroupClaim's Messages().
func (c *defaultConsumer) ConsumeClaim(session sarama.ConsumerGroupSession, claim sarama.ConsumerGroupClaim) error {
   for msg := range claim.Messages() {
      c.logger.Debugf(
         "message topic[%q] timestamp[%v] partition[%d] offset[%d]",
         msg.Topic, msg.Timestamp, msg.Partition, msg.Offset,
      )

      // 解析消息
      pbMsg := &cevent.PbEventMessage{}
      err := json.Unmarshal(msg.Value, pbMsg)
      if nil != err {
           return errors.Wrapf(err, "msg unmarshal failed")
      }

      // 消费逻辑，失败返回错误
      if err := c.handler(pbMsg); err != nil {
           c.logger.Info(fmt.Sprintf("event handle failed, data: %s, err: %s", msg.Value, err))
           return errors.Wrapf(err, "event handle failed，data: %s", msg.Value)
      }
  


      // 成功，更新偏移量标记该消息已被消费过
      session.MarkMessage(msg, "")
   }

   return nil
}

由于至少一次消费语义，会导致消息重复消费，因此消费逻辑需要做幂等处理。

4、不同业务逻辑的 Consume 应该使用不同的 Group

一是，为了减少不同业务逻辑失败时之间的相互影响；二是，同一个消息在同一个 Group 的 Consume，只会被消费一次，否则存在部分 Consume 丢失消息的情况。

consume.Listen("order-pay-sms", message.PaySms{}.Handle)
consume.Listen("order-pay-wx", message.PayWx{}.Handle)

容错处理

为了保持最终数据一致性，消息在生产和消费时都做了重试机制。

Producer

1、推送失败重试机制

投递消息使用同步应答模式，当消息推送失败时，这里才用最大努力尝试策略保持数据最终一致性。

Consumer

2、消费异常重试机制

特别注意需要处理脏数据，防止因为错误数据导致消费阻塞。

3、只消费自己关注的 Type 类型消息

具体实现，见业务消费部分。

总结

在分布式系统中引入消息系统，使得各系统可以只关注自己的业务逻辑，系统维护性更强，同时能极大的提高系统的稳定性。但是由于具有异步特性，存在一定的使用场景限制，对于实时响应的系统，还是建议直接使用 RPC 调用完成交互。

商品价格的多币种方案

2019-02-28T05:00:00.000Z

假若，你是某个国内电商平台的商品中心项目负责人。突然今天，接到了一个这样的需求：商品在原人民币价格的基础架构上，须支持卢比（印度）价格。

需求

需求点，可以描述为：

购买的用户，商品价格需要支持卢比；
营运人员，商品管理系统依然使用人民币价格；

同样这个需求，定了以下两个硬指标：

必须实现需求；
必须快速上线；

问题

首先，我们必须承认的是，这确实是个简单的需求，但这也是个够坑爹的需求。主要遇到的问题如下：

涉及商品价格的系统众多；
各上层系统调用商品价格接口繁多；
商品价格相关字段较多；

为了实现快速上线，我们在原人民币的商品价格基础架构上，只能进行少量且合适的改造。所以，最后我们的改造方向为：尽量只改造商品价格源头系统，即商品中心，其他上层系统尽量不改动。

可行性调研

改造商品中心，商品价格支持卢比。可行的改造方案有 2 种：

1、数据表价格字段存卢比

将原人民币价格相关的数据表字段，存卢比值，数据表并新增人民币字段。

2、接口输出数据时转化为卢比

原人民币相关的数据表字段依然存人民币值，在接口输出数据时，将价格相关字段值转化为卢比。

针对以上方案，我们需要注意 2 个问题：

汇率会每天变化，所以商品价格也会变化；
后续商品价格，可能须支持多币种；

上述方案 ①，商品中心只需改造数据表。然后每天根据汇率刷新商品价格，原价格字段就都变成了卢比。方案相对简单，也容易操作，但缺点是：对任然需要人民币价格的系统，即商品管理系统须改造。
方案 ②，需要改造商品中心业务逻辑。由于涉及的价格字段较多，改造较复杂，主要优点是：汇率变动对商品价格影响较小，且可拓展支持多币种价格（可以根据地区标识，获取相应的商品价格）。

解决方案

最终，为了系统的可扩展性，我们选择了方案 ②。

这里主要改造了商品中心，主要解决透传地区标识和支持多币种价格这 2 个问题。

透传地区标识

我们的业务系统主要分为 API 和 Service 项目，API 暴露出 HTTP 接口，API 与 Service 和 Service 与 Service 之前使用 RPC 接口通信。由于商品中心涉及到价格的接口繁多，不可能对每个接口都增加地区标识的参数。所以我们弄了一套调用链路透传地区标识的机制。

机制原理

思路就是，先将地区标识放在全局上下文中，API 接口通过 Header 头X-Location携带地区标识；而对于 RPC 接口，我们的 RPC 框架已支持了 Context，不需要改造。

代码实现

传递全局上下文

由于 RPC 框架已支持了 Context，所以 API 和 RPC 接口透传全局上下文略有不同。实现如下：

class Location
{
    public static function init()
    {
        global $context;

        if (empty($context['location'])) {
            return;
        }

        // API在这里直接获取X-Location头
        if (!empty($_SERVER['HTTP_X_LOCATION'])) {
            $context['location'] = $_SERVER['HTTP_X_LOCATION'];
        }
        // RPC Server会自动获取Context
    }
}

上述init()方法，需要在项目入口位置初始化。

其中，RPC 接口不需要操作全局上下文。因为 RPC Client 在调用时会自动获取全局变量$context值并在 RPC 协议数据中追加 Context，同时 RPC Server 在收到请求时会自动获取 RPC 协议数据中的 Context 值并设置全局变量$context。

RPC Client 传递 Context 实现如下：

protected function addGlobalContext($data)
{
    global $context;

    $context = !is_array($context) ? array() : $context;
    
    // data为待请求的RPC协议数据
    $data['Context'] = $context;
    return $data;
}

RPC Server 获取 Context 实现如下：

public function getGlobalContext($packet)
{
    global $context;
    
    $context = array();
    // packet为接收的RPC协议数据
    if(isset($packet['Context'])) {
        $context = $packet['Context'];
    }
}

当设置了 Context 后，RPC 通信时协议数据会携带location字段，内容如下：

RPC
325
{"data":"{\"version\":\"1.0\",\"user\":\"xxx\",\"password\":\"xxx\",\"timestamp\":1553225486.5455,\"class\":\"xxx\",\"method\":\"xxx\",\"params\":[1]}","signature":"xxx","Context":{"location":"india"}}

设置地区标识

到这里，我们只需要在全局上下文设置地区标识即可。一旦我们设置了地区标识，所有业务系统就会在本次的调用链路中透传这个地区标识。实现如下：

class Location
{
    public static function set($location)
    {
        global $context;

        $context['location'] = $location;
        // API需要在这里单独设置X-Location头
        header('X-Location: ' . $context['location']);
    }
}

获取地区标识

设置了地区标识后，就可以在本次调用链路的所有业务系统中直接获取。实现如下：

class Location
{
    public static function get()
    {
        global $context;

        if (!isset($context['location'])) {
            return 'china';
        }

        return $context['location'];
    }
}

支持多币种价格

商品中心

有了地区标识后，商品中心服务就可以根据地区标识对价格字段进行转化了。因为设计到价格的数据表和价格字段较多，这里直接从数据层（Model）进行改造。

改造获取数据方法

下述的ReadBase类是所有数据表 Model 的基类，所有获取数据表数据的方法都继承或调用自getOne() 和getAll()方法，所以我们只需要改造这两个方法。

class ReadBase
{
    public function getOne(array $cond, $fields)
    {
        $data = $this->getReader()->select($this->getFields($fields))->from($this->getTableName())->where($cond)->queryRow();
        
        return $this->getExchangePrice($data);
    }
    
    public function getAll(array $cond, $fields)
    {
        $data = $this->getReader()->select($this->getFields($fields))->from($this->getTableName())->where($cond)->queryAll();
        
        if ($data) {
            foreach ($data as &$one) {
                 $this->getExchangePrice($one);
            }
        }
        
        return $data;
    }
}

后缀匹配价格字段

由于涉及到价格字段名字较多，且具有不确定性，所以这里使用后缀方式匹配。为了防止一些字段命名不规范，这里引入了黑名单机制。

protected function isExchangeField($field)
{
    $priceSuffix = array('cost', '_price');
    $black = array();
    $len = strlen($field) ;

    foreach ($priceSuffix as $suffix) {
        $lastPos = $len - strlen($suffix);
        // 非黑名单且非is_
        if (!in_array($field, $black)
            && false === strpos($field, 'is_')
            && $lastPos === strpos($field, $suffix)
        ) {
            return true;
        }
    }

    return false;
}

前缀为is_的字段一般定义为标识字段，默认为非价格字段。

计算地区价格

上述getExchangePrice()方法，用来根据地区标识转化价格覆盖到原价格字段，并自增以_origin后缀的人民币价格字段。

public function getExchangePrice(&$data)
{
    if (empty($data)) {
        return $data;
    }

    $originPrice = array();
    foreach ($data as $field => &$value) {
        // 是否是价格字段
        if ($this->isExchangeField($field)) {
            $originField = $field . '_origin';
            $originPrice[$originField] = $value;
            // 获取对应地区的价格
            $value = $this->getExchangePrice($value);
        }
    }
    
    $data = array_merge($originPrice, $data);

    return $data;
}

public static function getExchangePrice($price)
{
    // 获取地区标识
    $location = Location::get();
    // 汇率
    $exchangeRateConfig = \Config::$exchangeRate;
    if ($location === 'china') {
        return $price;
    } else if (isset($exchangeRateConfig[$location])) {
        $exchangeRate = $exchangeRateConfig[$location];
    } else {
        throw new \BusinessException("not found $location exchange rate");
    }
    // 向上取值并保留两位小数
    $exchangePrice = bcmul($price, $exchangeRate, 3);

    return number_format(ceil($exchangePrice * 100) / 100, 2, '.', '');
}

其中，getExchangePrice()方法会调用Location::get()获取地区标识，并根据汇率计算实时价格。

最终，商品中心改造后，得到的部分商品价格信息，如下：

# 人民币价格10，汇率10.87
market_price: 108.7
market_price_origin: 10

API系统

对于所有 API 的项目，我们只需要让客户端在所有的请求中增加X-Location头即可。

GET /product/detail/1 HTTP/1.1

Request Headers
  X-Location: india

API 项目需在入口文件处，初始化地区标识。如下：

Location::init();

商品管理系统

对于商品管理系统，我们为了方便运营操作，所有商品价格都应以人民币。因此，我们只需要初始化地区标识为中国，如下：

Location::init();
// 地区设置为中国
Location::set('china');

总结

为了实现需求很容易，但是要做到合理且快速却不简单。本文的实现的方案，避免了很多坑，但同时也可能又埋下了一些坑。没有一套方案是万能的，慢慢去优化吧！

负载均衡算法 — 平滑加权轮询

2018-12-02T12:45:12.000Z

在负载均衡算法 — 轮询一文中，我们就指出了加权轮询算法一个明显的缺陷。即在某些特殊的权重下，加权轮询调度会生成不均匀的实例序列，这种不平滑的负载可能会使某些实例出现瞬时高负载的现象，导致系统存在宕机的风险。为了解决这个调度缺陷，就提出了平滑加权轮询调度算法。

待解决的问题

为了说明平滑加权轮询调度的平滑性，使用以下 3 个特殊的权重实例来演示调度过程。

服务实例	权重值
192.168.10.1:2202	5
192.168.10.2:2202	1
192.168.10.3:2202	1

我们已经知道通过加权轮询算法调度后，会生成如下不均匀的调度序列。

请求	选中的实例
1	192.168.10.1:2202
2	192.168.10.1:2202
3	192.168.10.1:2202
4	192.168.10.1:2202
5	192.168.10.1:2202
6	192.168.10.2:2202
7	192.168.10.3:2202

接下来，我们就使用平滑加权轮询算法调度上述实例，看看生成的实例序列如何？

算法描述

假设有 N 台实例 S = {S1, S2, …, Sn}，配置权重 W = {W1, W2, …, Wn}，有效权重 CW = {CW1, CW2, …, CWn}。每个实例 i 除了存在一个配置权重 Wi 外，还存在一个当前有效权重 CWi，且 CWi 初始化为 Wi；指示变量 currentPos 表示当前选择的实例 ID，初始化为 -1；所有实例的配置权重和为 weightSum；

那么，调度算法可以描述为：
1、初始每个实例 i 的 当前有效权重 CWi 为 配置权重 Wi，并求得配置权重和 weightSum；
2、选出 当前有效权重 最大的实例，将 当前有效权重 CWi 减去所有实例的 权重和 weightSum，且变量 currentPos 指向此位置；
3、将每个实例 i 的 当前有效权重 CWi 都加上 配置权重 Wi；
4、此时变量 currentPos 指向的实例就是需调度的实例；
5、每次调度重复上述步骤 2、3、4；

上述 3 个服务，配置权重和 weightSum 为 7，其调度过程如下：

请求	选中前的当前权重	currentPos	选中的实例	选中后的当前权重
1	{5, 1, 1}	0	192.168.10.1:2202	{-2, 1, 1}
2	{3, 2, 2}	0	192.168.10.1:2202	{-4, 2, 2}
3	{1, 3, 3}	1	192.168.10.2:2202	{1, -4, 3}
4	{6, -3, 4}	0	192.168.10.1:2202	{-1, -3, 4}
5	{4, -2, 5}	2	192.168.10.3:2202	{4, -2, -2}
6	{9, -1, -1}	0	192.168.10.1:2202	{2, -1, -1}
7	{7, 0, 0}	0	192.168.10.1:2202	{0, 0, 0}
8	{5, 1, 1}	0	192.168.10.1:2202	{-2, 1, 1}

可以看出上述调度序列分散是非常均匀的，且第 8 次调度时当前有效权重值又回到 {0, 0, 0}，实例的状态同初始状态一致，所以后续可以一直重复调度操作。

此轮询调度算法思路首先被 Nginx 开发者提出，见 phusion/nginx 部分。

代码实现

这里使用 PHP 来实现，源码见 fan-haobai/load-balance 部分。

class SmoothWeightedRobin implements RobinInterface
{
    private $services = array();

    private $total;

    private $currentPos = -1;

    public function init(array $services)
    {
        foreach ($services as $ip => $weight) {
            $this->services[] = [
                'ip'      => $ip,
                'weight'  => $weight,
                'current_weight' => $weight,
            ];
        }
        $this->total = count($this->services);
    }

    public function next()
    {
        // 获取最大当前有效权重实例的位置
        $this->currentPos = $this->getMaxCurrentWeightPos();

        // 当前权重减去权重和
        $currentWeight = $this->getCurrentWeight($this->currentPos) - $this->getSumWeight();
        $this->setCurrentWeight($this->currentPos, $currentWeight);

        // 每个实例的当前有效权重加上配置权重
        $this->recoverCurrentWeight();

        return $this->services[$this->currentPos]['ip'];
    }
}

其中，getSumWeight()为所有实例的配置权重和；getCurrentWeight()和 setCurrentWeight()分别用于获取和设置指定实例的当前有效权重；getMaxCurrentWeightPos()求得最大当前有效权重的实例位置，实现如下：

public function getMaxCurrentWeightPos()
{
    $currentWeight = $pos = 0;
    foreach ($this->services as $index => $service) {
        if ($service['current_weight'] > $currentWeight) {
            $currentWeight = $service['current_weight'];
            $pos = $index;
        }
    }

    return $pos;
}

recoverCurrentWeight()用于调整每个实例的当前有效权重，即加上配置权重，实现如下：

public function recoverCurrentWeight()
{
    foreach ($this->services as $index => &$service) {
        $service['current_weight'] += $service['weight'];
    }
}

需要注意的是，在配置services服务列表时，同样需要指定其权重：

$services = [
    '192.168.10.1:2202' => 5,
    '192.168.10.2:2202' => 1,
    '192.168.10.3:2202' => 1,
];

数学证明

可惜的是，关于此调度算法严谨的数学证明少之又少，不过网友 tenfy 给出的安大神证明过程，非常值得参考和学习。

证明权重合理性

假如有 n 个结点，记第 i 个结点的权重是 $x_i$，设总权重为 $S = x_1 + x_2 + … + x_n$。选择分两步：
1、为每个节点加上它的权重值；
2、选择最大的节点减去总的权重值；

n 个节点的初始化值为 [0, 0, …, 0]，数组长度为 n，值都为 0。第一轮选择的第 1 步执行后，数组的值为 $[x_1, x_2, …, x_n]$。

假设第 1 步后，最大的节点为 j，则第 j 个节点减去 S。
所以第 2 步的数组为 $[x_1, x_2, …, x_j-S, …, x_n]$。执行完第 2 步后，数组的和为：
$x_1 + x_2 + … + x_j-S + … + x_n => x_1 + x_2 + … + x_n - S = S - S = 0$

由此可见，每轮选择第 1 步操作都是数组的总和加上 S，第 2 步总和再减去 S，所以每轮选择完后的数组总和都为 0。

假设总共执行 S 轮选择，记第 i 个结点选择 $m_i$ 次。第 i 个结点的当前权重为 $w_i$。假设节点 j 在第 t 轮（t < S）之前，已经被选择了 $x_j$ 次，记此时第 j 个结点的当前权重为 $w_j = t * x_j - x_j * S = (t - S) * x_j < 0$，因为 t 恒小于 S，所以 $w_j < 0$。

前面假设总共执行 S 轮选择，则剩下 S-t 轮 j 都不会被选中，上面的公式 $w_j = (t - S) * x_j + (S - t) * x_j = 0$。所以在剩下的选择中，$w_j$ 永远小于等于 0，由于上面已经证明任何一轮选择后，数组总和都为 0，则必定存在一个节点 k 使得 $w_k > 0$，永远不会再选中节点 j。

由此可以得出，第 i 个结点最多被选中 $x_i$ 次，即 $m_i <= x_i$。
因为 $S = m_1 + m_2 + … + m_n$ 且 $S = x_1 + x_2 + … + x_n$。所以，可以得出 $m_i == x_i$。

证明平滑性

证明平滑性，只要证明不要一直都是连续选择那一个节点即可。

跟上面一样，假设总权重为 S，假如某个节点 i 连续选择了 t（$t < x_i$）次，只要存在下一次选择的不是节点 i，即可证明是平滑的。

假设 $t = x_i - 1$，此时第 i 个结点的当前权重为 $w_i = t * x_i - t * S = (x_i - 1) * x_i - (x_i - 1) * S$。证明下一轮的第 1 步执行完的值 $w_i + x_i$ 不是最大的即可。

$w_i + x_i => (x_i - 1) * x_i - (x_i - 1) * S + x_i =>$
$x_i^2 - x_i * S + S => (x_i - 1) * (x_i - S) + x_i$

因为 $x_i$ 恒小于 S，所以 $x_i - S <= -1$。所以上面：
$(x_i - 1) * (x_i - S) + x_i <= (x_i - 1) * -1 + x_i = -x_i + 1 + x_i = 1$

所以第 t 轮后，再执行完第 1 步的值 $w_i + x_i <= 1$。
如果这 t 轮刚好是最开始的 t 轮，则必定存在另一个结点 j 的值为 $x_j * t$，所以有 $w_i + x_i <= 1 < 1 * t < x_j * t$。所以下一轮肯定不会选中 i。

总结

尽管，平滑加权轮询算法改善了加权轮询算法调度的缺陷，即调度序列分散的不均匀，避免了实例负载突然加重的可能，但是仍然不能动态感知每个实例的负载。

若由于实例权重配置不合理，或者一些其他原因加重系统负载的情况，平滑加权轮询都无法实现每个实例的负载均衡，这时就需要有状态的调度算法来完成。

相关文章 »

负载均衡算法 — 轮询（2018-11-29）

负载均衡算法 — 轮询

2018-11-29T11:20:10.000Z

在分布式系统中，为了实现负载均衡，必然会涉及到负载调度算法，如 Nginx 和 RPC 服务发现等场景。常见的负载均衡算法有轮询、源地址 Hash、最少连接数，而轮询是最简单且应用最广的算法。

3 种常见的轮询调度算法，分别为简单轮询、加权轮询、平滑加权轮询。本文将用如下 4 个服务，来详细说明轮询调度过程。

服务实例	权重值
192.168.10.1:2202	1
192.168.10.2:2202	2
192.168.10.3:2202	3
192.168.10.4:2202	4

简单轮询

简单轮询是轮询算法中最简单的一种，但由于它不支持配置负载，所以应用较少。

算法描述

假设有 N 台实例 S = {S1, S2, …, Sn}，指示变量 currentPos 表示当前选择的实例 ID，初始化为 -1。算法可以描述为：
1、调度到下一个实例；
2、若所有实例已被调度过一次，则从头开始调度；
3、每次调度重复步骤 1、2；

调度过程，如下：

请求	currentPos	选中的实例
1	0	192.168.10.1:2202
2	1	192.168.10.2:2202
3	2	192.168.10.3:2202
4	3	192.168.10.4:2202
5	0	192.168.10.1:2202

代码实现

这里使用 PHP 来实现，源码见 fan-haobai/load-balance 部分。

首先，定义一个统一的操作接口，主要有init()和next()这 2 个方法。

interface RobinInterface
{
    /**
     * 初始化服务权重
     *
     * @param array $services
     *
     * @return mixed
     */
    public function init(array $services);

    /**
     * 获取一个服务
     *
     * @return mixed
     */
    public function next();

}

然后，根据简单轮询算法思路，实现上述接口：

class Robin implements RobinInterface
{
    private $services = array();

    private $total;

    private $currentPos = -1;

    public function init(array $services)
    {
        $this->services = $services;
        $this->total = count($services);
    }

    public function next()
    {
        // 已调度完一圈,重置currentPos值为第一个实例位置
        $this->currentPos = ($this->currentPos + 1) % $this->total;

        return $this->services[$this->currentPos];
    }

}

其中，total为总实例数量，services为服务实例列表。由于简单轮询不需要配置权重，因此可简单配置为：

$services = [
    '192.168.10.1:2202',
    '192.168.10.2:2202',
    '192.168.10.3:2202',
    '192.168.10.4:2202',
];

优缺点分析

在实际应用中，同一个服务会部署到不同的硬件环境，会出现性能不同的情况。若直接使用简单轮询调度算法，给每个服务实例相同的负载，那么，必然会出现资源浪费的情况。因此为了避免这种情况，一些人就提出了下面的加权轮询算法。

加权轮询

加权轮询算法引入了“权”值，改进了简单轮询算法，可以根据硬件性能配置实例负载的权重，从而达到资源的合理利用。

算法描述

假设有 N 台实例 S = {S1, S2, …, Sn}，权重 W = {W1, W2, …, Wn}，指示变量 currentPos 表示当前选择的实例 ID，初始化为 -1；变量 currentWeight 表示当前权重，初始值为 max(S)；max(S) 表示 N 台实例的最大权重值，gcd(S) 表示 N 台实例权重的最大公约数。

算法可以描述为：
1、从上一次调度实例起，遍历后面的每个实例；
2、若所有实例已被遍历过一次，则减小 currentWeight 为 currentWeight - gcd(S)，并从头开始遍历；若 currentWeight 小于等于 0，则重置为 max(S)；
3、直到遍历的实例的权重大于等于 currentWeight 时结束，此时实例为需调度的实例；
4、每次调度重复步骤 1、2、3；

例如，上述 4 个服务，最大权重 max(S) 为 4，最大公约数 gcd(S) 为 1。其调度过程如下：

请求	currentPos	currentWeight	选中的实例
1	3	4	192.168.10.4:2202
2	2	3	192.168.10.3:2202
3	3	3	192.168.10.4:2202
4	1	2	192.168.10.2:2202
…	…	…	….
9	2	1	192.168.10.3:2202
10	3	4	192.168.10.4:2202

代码实现

这里使用 PHP 来实现，源码见 fan-haobai/load-balance 部分。

class WeightedRobin implements RobinInterface
{
    private $services = array();

    private $total;

    private $currentPos = -1;

    private $currentWeight;

    public function init(array $services)
    {
        foreach ($services as $ip => $weight) {
            $this->services[] = [
                'ip'     => $ip,
                'weight' => $weight,
            ];
        }

        $this->total = count($this->services);
    }

    public function next()
    {
        $i = $this->currentPos;
        while (true) {
            $i = ($i + 1) % $this->total;

            // 已全部被遍历完一次
            if (0 === $i) {
                // 减currentWeight
                $this->currentWeight -= $this->getGcd();

                // 赋值currentWeight为0,回归到初始状态
                if ($this->currentWeight <= 0) {
                    $this->currentWeight = $this->getMaxWeight();
                }
            }

            // 直到当前遍历实例的weight大于或等于currentWeight
            if ($this->services[$i]['weight'] >= $this->currentWeight) {
                $this->currentPos = $i;

                return $this->services[$this->currentPos]['ip'];
            }
        }
    }

其中，getMaxWeight()为所有实例的最大权重值；getGcd()为所有实例权重的最大公约数，主要是通过gcd()方法（可用gmp_gcd()函数）求得 2 个数的最大公约数，然后求每一个实例的权重与当前最大公约数的最大公约数。实现如下：

private function getGcd()
{
    $gcd = $this->services[0]['weight'];

    for ($i = 0; $i < $this->total; $i++) {
        $gcd = $this->gcd($gcd, $this->services[$i]['weight']);
    }

    return $gcd;
}

需要注意的是，在配置services服务列表时，需要指定其权重：

$services = [
    '192.168.10.1:2202' => 1,
    '192.168.10.2:2202' => 2,
    '192.168.10.3:2202' => 3,
    '192.168.10.4:2202' => 4,
];

优缺点分析

加权轮询算法虽然通过配置实例权重，解决了简单轮询的资源利用问题，但是它还是存在一个比较明显的缺陷。例如：

服务实例 S = {a, b, c}，权重 W = {5, 1, 1}，使用加权轮询调度生成的实例序列为 {a, a, a, a, a, b, c}，那么就会存在连续 5 个请求都被调度到实例 a。而实际中，这种不均匀的负载是不被允许的，因为连续请求会突然加重实例 a 的负载，可能会导致严重的事故。

为了解决加权轮询调度不均匀的缺陷，一些人提出了平滑加权轮询调度算法，它会生成的更均匀的调度序列 {a, a, b, a, c, a, a}。对于神秘的平滑加权轮询算法，我将在后续文章中详细介绍它的原理和实现。

总结

轮询算法是最简单的调度算法，因为它无需记录当前所有连接的状态，所以它是一种无状态的调度算法，这些特性使得它应用较广。

轮询调度算法并不能动态感知每个实例的负载，它完全依赖于我们的工程经验，人为配置权重来实现基本的负载均衡，并不能保证服务的高可用性。若服务的某些实例因其他原因负载突然加重，轮询调度还是会一如既往地分配请求给这个实例，因此可能会形成小面积的宕机，导致服务的局部不可用。

相关文章 »

负载均衡算法 — 平滑加权轮询（2018-11-30）

用PHP玩转进程之二 — 多进程PHPServer

2018-09-02T08:10:53.000Z

经过用 PHP 玩转进程之一 — 基础的回顾复习，我们已经掌握了进程的基础知识，现在可以尝试用 PHP 做一些简单的进程控制和管理，来加深我们对进程的理解。接下来，我将用多进程模型实现一个简单的 PHPServer，基于它你可以做任何事。

PHPServer 完整的源代码，可前往 fan-haobai/php-server 获取。

总流程

该 PHPServer 的 Master 和 Worker 进程主要控制流程，如下图所示：

其中，主要涉及 3 个对象，分别为入口脚本、Master 进程、Worker 进程。它们扮演的角色如下：

入口脚本：主要实现 PHPServer 的启动、停止、重载功能，即触发 Master 进程start、stop、reload流程；
Master 进程：负责创建并监控 Worker 进程。在启动阶段，会注册信号处理器，然后创建 Worker；在运行阶段，会持续监控 Worker 进程健康状态，并接受来自入口脚本的控制信号并作出响应；在停止阶段，会停止掉所有 Worker 进程；
Worker 进程：负责执行业务逻辑。在被 Master 进程创建后，就处于持续运行阶段，会监听到来自 Master 进程的信号，以实现自我的停止；

整个过程，又包括 4 个流程：

流程 ① ：以守护态启动 PHPServer 时的主要流程。入口脚本会进行 daemonize，也就是实现进程的守护态，此时会fork出一个 Master 进程；Master 进程先经过保存 PID、注册信号处理器操作，然后创建 Worker 会fork出多个 Worker 进程；
流程 ② ：为 Master 进程持续监控的流程，过程中会捕获入口脚本发送来的信号。主要监控 Worker 进程健康状态，当 Worker 进程异常退出时，会尝试创建新的 Worker 进程以维持 Worker 进程数量；
流程 ③ ：为 Worker 进程持续运行的流程，过程中会捕获 Master 进程发送来的信号。流程 ① 中 Worker 进程被创建后，就会持续执行业务逻辑，并阻塞于此；
流程 ④ ：停止 PHPServer 的主要流程。入口脚本首先会向 Master 进程发送 SIGINT 信号，Master 进程捕获到该信号后，会向所有的 Worker 进程转发 SIGINT 信号（通知所有的 Worker 进程终止），等待所有 Worker 进程终止退出；

在流程 ② 中，Worker 进程被 Master 进程fork出来后，就会持续运行并阻塞于此，只有 Master 进程才会继续后续的流程。

代码实现

启动

启动流程见流程 ①，主要包括守护进程、保存 PID、注册信号处理器、创建多进程 Worker 这 4 部分。

守护进程

首先，在入口脚本中fork一个子进程，然后该进程退出，并设置新的子进程为会话组长，此时的这个子进程就会脱离当前终端的控制。如下图所示：

这里使用了 2 次fork，所以最后fork的一个子进程才是 Master 进程，其实一次fork也是可以的。代码如下：

protected static function daemonize()
{
    umask(0);
    $pid = pcntl_fork();
    if (-1 === $pid) {
        exit("process fork fail\n");
    } elseif ($pid > 0) {
        exit(0);
    }

    // 将当前进程提升为会话leader
    if (-1 === posix_setsid()) {
        exit("process setsid fail\n");
    }

    // 再次fork以避免SVR4这种系统终端再一次获取到进程控制
    $pid = pcntl_fork();
    if (-1 === $pid) {
        exit("process fork fail\n");
    } elseif (0 !== $pid) {
        exit(0);
    }
}

通常在启动时增加-d参数，表示进程将运行于守护态模式。

当顺利成为一个守护进程后，Master 进程已经脱离了终端控制，所以有必要关闭标准输出和标准错误输出。如下：

protected static function resetStdFd()
{
    global $STDERR, $STDOUT;
    //重定向标准输出和错误输出
    @fclose(STDOUT);
    fclose(STDERR);
    $STDOUT = fopen(static::$stdoutFile, 'a');
    $STDERR = fopen(static::$stdoutFile, 'a');
}

保存PID

为了实现 PHPServer 的重载或停止，我们需要将 Master 进程的 PID 保存于 PID 文件中，如php-server.pid文件。代码如下：

protected static function saveMasterPid()
{
    // 保存pid以实现重载和停止
    static::$_masterPid = posix_getpid();
    if (false === file_put_contents(static::$pidFile, static::$_masterPid)) {
        exit("can not save pid to" . static::$pidFile . "\n");
    }

    echo "PHPServer start\t \033[32m [OK] \033[0m\n";
}

注册信号处理器

因为守护进程一旦脱离了终端控制，就犹如一匹脱缰的野马，任由其奔腾可能会为所欲为，所以我们需要去驯服它。

这里使用信号来实现进程间通信并控制进程的行为，注册信号处理器如下：

protected static function installSignal()
{
    pcntl_signal(SIGINT, array('\PHPServer\Worker', 'signalHandler'), false);
    pcntl_signal(SIGTERM, array('\PHPServer\Worker', 'signalHandler'), false);

    pcntl_signal(SIGUSR1, array('\PHPServer\Worker', 'signalHandler'), false);
    pcntl_signal(SIGQUIT, array('\PHPServer\Worker', 'signalHandler'), false);

    // 忽略信号
    pcntl_signal(SIGUSR2, SIG_IGN, false);
    pcntl_signal(SIGHUP,  SIG_IGN, false);
}

protected static function signalHandler($signal)
{
    switch($signal) {
        case SIGINT:
        case SIGTERM:
            static::stop();
            break;
        case SIGQUIT:
        case SIGUSR1:
            static::reload();
            break;
        default: break;
    }
}

其中，SIGINT 和 SIGTERM 信号会触发stop操作，即终止所有进程；SIGQUIT 和 SIGUSR1 信号会触发reload操作，即重新加载所有 Worker 进程；此处忽略了 SIGUSR2 和 SIGHUP 信号，但是并未忽略 SIGKILL 信号，即所有进程都可以被强制kill掉。

创建多进程Worker

Master 进程通过fork系统调用，就能创建多个 Worker 进程。实现代码，如下：

protected static function forkOneWorker()
{
    $pid = pcntl_fork();

    // 父进程
    if ($pid > 0) {
        static::$_workers[] = $pid;
    } else if ($pid === 0) { // 子进程
        static::setProcessTitle('PHPServer: worker');

        // 子进程会阻塞在这里
        static::run();

        // 子进程退出
        exit(0);
    } else {
        throw new \Exception("fork one worker fail");
    }
}

protected static function forkWorkers()
{
    while(count(static::$_workers) < static::$workerCount) {
        static::forkOneWorker();
    }
}

Worker进程的持续运行

Worker 进程的持续运行，见流程 ③ 。其内部调度流程，如下图：

对于 Worker 进程，run()方法主要执行具体业务逻辑，当然 Worker 进程会被阻塞于此。对于任务 ① 这里简单地使用while来模拟调度，实际中应该使用事件（Select 等）驱动。

public static function run()
{
    // 模拟调度,实际用event实现
    while (1) {
        // 捕获信号
        pcntl_signal_dispatch();

        call_user_func(function() {
            // do something
            usleep(200);
        });
    }
}

其中，pcntl_signal_dispatch()会在每次调度过程中，捕获信号并执行注册的信号处理器。

Master进程的持续监控

调度流程

Master 进程的持续监控，见流程 ② 。其内部调度流程，如下图：

对于 Master 进程的调度，这里也使用了while，但是引入了wait的系统调用，它会挂起当前进程，直到一个子进程退出或接收到一个信号。

protected static function monitor()
{
    while (1) {
        // 这两处捕获触发信号,很重要
        pcntl_signal_dispatch();
        // 挂起当前进程的执行直到一个子进程退出或接收到一个信号
        $status = 0;
        $pid = pcntl_wait($status, WUNTRACED);
        pcntl_signal_dispatch();

        if ($pid >= 0) {
            // worker健康检查
            static::checkWorkerAlive();
        }
        // 其他你想监控的
    }
}

第两次的pcntl_signal_dispatch()捕获信号，是由于wait挂起时间可能会很长，而这段时间可能恰恰会有信号，所以需要再次进行捕获。

其中，PHPServer 的停止和重载操作是由信号触发，在信号处理器中完成具体操作；Worker 进程的健康检查会在每一次的调度过程中触发。

Worker进程的健康检查

由于 Worker 进程执行繁重的业务逻辑，所以可能会异常崩溃。因此 Master 进程需要监控 Worker 进程健康状态，并尝试维持一定数量的 Worker 进程。健康检查流程，如下图：

代码实现，如下：

protected static function checkWorkerAlive()
{
    $allWorkerPid = static::getAllWorkerPid();
    foreach ($allWorkerPid as $index => $pid) {
        if (!static::isAlive($pid)) {
            unset(static::$_workers[$index]);
        }
    }

    static::forkWorkers();
}

停止

Master 进程的持续监控，见流程 ④ 。其详细流程，如下图：

入口脚本给 Master 进程发送 SIGINT 信号，Master 进程捕获到该信号并执行信号处理器，调用stop()方法。如下：

protected static function stop()
{
    // 主进程给所有子进程发送退出信号
    if (static::$_masterPid === posix_getpid()) {
        static::stopAllWorkers();

        if (is_file(static::$pidFile)) {
            @unlink(static::$pidFile);
        }
        exit(0);
    } else { // 子进程退出

        // 退出前可以做一些事
        exit(0);
    }
}

若是 Master 进程执行该方法，会先调用stopAllWorkers()方法，向所有的 Worker 进程发送 SIGINT 信号并等待所有 Worker 进程终止退出，再清除 PID 文件并退出。有一种特殊情况，Worker 进程退出超时时，Master 进程则会再次发送 SIGKILL 信号强制杀死所有 Worker 进程；

由于 Master 进程会发送 SIGINT 信号给 Worker 进程，所以 Worker 进程也会执行该方法，并会直接退出。

protected static function stopAllWorkers()
{
    $allWorkerPid = static::getAllWorkerPid();
    foreach ($allWorkerPid as $workerPid) {
        posix_kill($workerPid, SIGINT);
    }

    // 子进程退出异常,强制kill
    usleep(1000);
    if (static::isAlive($allWorkerPid)) {
        foreach ($allWorkerPid as $workerPid) {
            static::forceKill($workerPid);
        }
    }

    // 清空worker实例
    static::$_workers = array();
}

重载

代码发布后，往往都需要进行重新加载。其实，重载过程只需要重启所有 Worker 进程即可。流程如下图：

整个过程共有 2 个流程，流程 ① 终止所有的 Worker 进程，流程 ② 为 Worker 进程的健康检查。其中流程 ① ，入口脚本给 Master 进程发送 SIGUSR1 信号，Master 进程捕获到该信号，执行信号处理器调用reload()方法，reload()方法调用stopAllWorkers()方法。如下：

protected static function reload()
{
    // 停止所有worker即可,master会自动fork新worker
    static::stopAllWorkers();
}

reload()方法只会在 Master 进程中执行，因为 SIGQUIT 和 SIGUSR1 信号不会发送给 Worker 进程。

你可能会纳闷，为什么我们需要重启所有的 Worker 进程，而这里只是停止了所有的 Worker 进程？这是因为，在 Worker 进程终止退出后，由于 Master 进程对 Worker 进程的健康检查作用，会自动重新创建所有 Worker 进程。

运行效果

到这里，我们已经完成了一个多进程 PHPServer。我们来体验一下：

$ php server.php 
Usage: Commands [mode] 

Commands:
startStart worker.
stopStop worker.
reloadReload codes.

Options:
-dto start in DAEMON mode.

Use "--help" for more information about a command.

首先，我们启动它：

$ php server.php start -d
PHPServer start  [OK]

其次，查看进程树，如下：

$ pstree -p
init(1)-+-init(3)---bash(4)
        |-php(1286)-+-php(1287)
                    `-php(1288)

最后，我们把它停止：

$ php server.php stop
PHPServer stopping ...
PHPServer stop success

现在，你是不是感觉进程控制其实很简单，并没有我们想象的那么复杂。(￣┰￣*)

总结

我们已经实现了一个简易的多进程 PHPServer，模拟了进程的管理与控制。需要说明的是，Master 进程可能偶尔也会异常地崩溃，为了避免这种情况的发生：

首先，我们不应该给 Master 进程分配繁重的任务，它更适合做一些类似于调度和管理性质的工作；
其次，可以使用 Supervisor 等工具来管理我们的程序，当 Master 进程异常崩溃时，可以再次尝试被拉起，避免 Master 进程异常退出的情况发生。

相关文章 »

用PHP玩转进程之一 — 基础（2018-08-28）

用PHP玩转进程之一 — 基础

2018-08-28T12:30:07.000Z

我们工作中接触最多的就是进程，但是我们对它又比较陌生，因为它是业务不需要关心的地方，既有的公有组件和操作系统已经对我们屏蔽了它的复杂性。然后跟它的接触时间一长，我们难免会对它产生好奇：How it works?

什么是进程

进程是程序的实体，是系统进行资源分配和调度的基本单位，是操作系统结构的基础。每个进程都有自己唯一标识（PID），每个进程都有父进程，这些父进程也有父进程，所有进程都是init进程（PID 为 1）的子进程。

我们来直观感受下它的存在，可以说它是看不见又摸不着。

$ pstree -p
init(1)-+-init(3)---bash(4)
        |-nginx(771)-+-nginx(773)
        |            |-nginx(774)
        |            |-nginx(776)
        |            `-nginx(777)
        |-php-fpm(702)-+-php-fpm(707)
                       `-php-fpm(712)

进程分类

前台进程

前台进程具有控制终端，会堵塞控制终端。它的特点是：

可以同用户交互，但容易被意外终止；
有较高的响应速度，优先级别稍高；

$ php server.php start
PHPServer start  [OK] 

# 堵塞了/_ \

通常，在控制终端使用Ctrl+C组合键，会导致前台进程终止退出。

守护进程

守护进程是一种运行在后台的特殊进程，因为它不属于任何一个终端，所以不会收到任何终端发来的任何信号。它与前台进程显著的区别是：

它没有控制终端，不能直接和用户交互，在后台运行；
它不受用户登录和注销的影响，只受开机或关机的影响，可以长期运行；

通常我们编写的程序，都需要在后台不终止的长期运行，此时就可以使用守护进程。当然，我们可以在代码中调用系统函数，或者直接在启动命令后追加&操作符，如下：

$ nohup php server.php start &
# &使进程脱离控制终端运行

通常&与 nohup 结合使用，忽略 SIGHUP 信号来实现一个守护进程。该方式对业务代码侵入最小，方便且成本低，常用于临时执行任务脚本的场景。

进程间通信（InterProcess Communication）

进程的用户空间是相互独立的，一般而言是不能相互访问。但很多情况下，进程间需要互相通信来进行数据传输、共享数据、通知事件、进程控制等，这就必须通过内核实现进程间通信。

进程间通信有管道、消息队列、信号、共享内存、套接字等方式，本文只介绍后 3 种。

共享内存（Shared Memory）

共享内存是一段被映射到多个进程地址空间的内存，虽然这段共享内存是由一个进程创建，但是多个进程都可以访问。如下图：

共享内存是最快的进程间通信方式，但是可能会存在竞争，因此需要加锁。Linux 支持三种共享内存：mmap、Posix、以及 System V。

套接字（Socket）

套接字是一个通信链的句柄，可以用域、端口号、协议类型来表示一个套接字，其中域分为 Internet 网络（IP 地址）和 UNIX 文件（Sock 文件）两种。当域为 Internet 网络时，通信流程如下图：

特别的是，当套接字域为 Internet 网络时，可以实现跨主机的进程间通信。因此，若要实现跨主机进行进程间通信，则须选用套接字。

信号（Signal）

信号受事件驱动，是一种异步且最复杂的通信方式，用于通知接受进程有某个事件已经发生，因此常用于事件处理。信号的处理机制，如下图：

常用的信号值

在 Linux 系统中，可使用kill -l命令查看这 62 个信号值。其中常用值如下：

信号名称	值	说明	进程默认行为
SIGHUP	1	终端控制进程结束	Terminate
SIGINT	2	键盘Ctrl+C被按下	Terminate
SIGQUIT	3	键盘Ctrl+/被按下	Dump
SIGKILL	9	无条件结束进程	Terminate
SIGUSR1	10	用户保留	Terminate
SIGUSR2	12	用户保留	Terminate
SIGALRM	14	时钟定时信号	Terminate
SIGTERM	15	程序结束	Terminate
SIGCHLD	16	子进程结束	Ignore

产生信号的方式

实际中，硬件或者软件中断都会触发信号，但这里只列举两种信号产生方式。

终端按键

按键/命令	信号名称
Ctrl+C	SIGINT
Ctrl+\	SIGQUIT
EXIT	SIGHUP

系统调用

通过kill系统调用发送信号。例如，在 Shell 中使用kill -9发送 SIGKILL 信号。对于kill调用，需要注意以下两种特殊情况：

1、特殊信号

可以发送编号为0的信号来检测进程是否存活。

$pid = 577;
if (posix_kill($pid, 0)) {
    echo "进程存在\n";
} else {
    echo "进程不存在\n";
}

2、特殊 PID

这里的参数$pid，根据取值范围不同，含义也不同。具体如下：

$pid > 0：向 PID 为 $pid 的进程发送信号；
$pid = 0：向当前进程组所有进程发送信号，比较常用；
$pid = -1：向所有进程（除 PID 为 1）发送信号（权限）；

进程的处理方式

进程共有 3 种处理信号的方式：

默认行为；
忽略；
捕获并处理—注册信号处理器后，当捕获到信号时，执行对应的处理器；

其中，默认行为进一步可以细分为以下几种：

默认处理类型	描述
Terminate	进程被中止(杀死)
Dump	进程被中止(杀死)，并且输出 dump 文件
Ignore	信号被忽略
Stop	进程被停止

信号的默认行为类型，见常用的信号值默认行为部分。

进程间关系

使用ps -ajx命令查看所有进程信息，如下：

#父PID  PID  组ID 会话ID 终端      时间   名称
PPID   PID  PGID   SID TTY      TIME COMMAND
    0     1     1     1 ?       0:00 /init ro
    1    43    43    43 ?       0:00 /usr/sbin/sshd
   43 11134 11134 11134 ?       0:00 sshd: root@pts/1
11134 11169 11169 11169 pts/1   0:00 -bash
11169 11251 11251 11169 pts/1   0:00 PHPServer: master   
11251 11252 11251 11169 pts/1   0:36 PHPServer: worker   
11251 11253 11251 11169 pts/1   0:42 PHPServer: worker

进程组（Process Group）

进程组是一个或多个进程的集合。每个进程除了有一个 PID 之外还有一个进程组 ID（GID），每个进程都属于一个进程组，每个进程都有一个组长进程。

如上图中，1 个PHPServer: master主进程和 2 个PHPServer: worker子进程，属于同一个进程组11251，可以看出主进程是组长进程。

会话（Session）

会话是一个或多个进程组的集合，一个会话有对应的控制终端。如上图中，4 个PHPServer进程和-bash进程同属于一个会话，因为他们在一个pts/1的控制终端。

需要说明的是，当用户退出（Logout）会话以后，系统默认对该会话下的进程进行如下操作：

系统向该会话发出 SIGHUP 信号；
该会话将 SIGHUP 信号发给所有子进程；
子进程收到 SIGHUP 信号后，自动退出；

而对于后台进程，用户在退出时系统默认不会发送 SIGHUP 信号，这是由 Shell 的huponexit参数（默认off）控制。可通过shopt -s huponexit设置成on（当前会话有效），此时后台进程会收到 SIGHUP 信号。

进程模型

从进程层面来说，程序可以分为单进程和多进程模型。

单进程

单进程模型的程序，只有一个进程在运行。他是最基本的进程模型，实现起来比较简单，Redis 就是采用这种进程模型。

多进程

为了提高程序的并发处理能力，程序由单进程慢慢演变成了多进程，一个 Master 进程和多个 Worker 进程是多进程常见的构成形态。可以说，现在大部分程序都是多进程模型，其中 Nginx 是典型的代表。

总结

到这里，我们已经对进程有了基础的认识，后续我将用 PHP 一步步实现一个 PHPServer 应用。

相关文章 »

用PHP玩转进程之二 — 多进程PHPServer （2018-09-02）

从北京回到成都的这3个月

2018-06-27T12:00:00.000Z

今年 3 月从自如离职，然后就回成都并加入了聚美，我的北漂记忆也就定格在了自如。回来 3 个月，为了这个伟大的决定，一直想写篇文章，今天刚刚好，这篇文章将叙述自己回成都后经历的事和见闻，有想来成都发展的小伙伴可以以此为参考。

公司

说到成都，很多人（包括小马哥）都会扔出一句“少不入川，老不出川”。他们认为，成都生活安逸，适合养老，年轻人容易失去斗志，但是我并不认同，小马哥后面也改变看法了，因为 N 逼的天美工作室。

现在的成都，有很多互联网公司入驻，虽说条件比不上北上深，但是在工作和生活平衡点上，是可以安居乐业的；政府也在大力培育“独角兽”企业，未来就业前景也是可期的。至于待遇方面，普遍比北上深低 20~30% 左右，还是那句话：如果你真牛逼，也没有什么是不可能的。

现在来说说聚美。目前我主要负责商品中心和库存中心系统，这两个系统作为核心的基础服务，日调用量最高且系统可靠性要求高。

从行业上来看：

聚美曾经辉煌过，所以大家对其一直有很高的期待，现在聚美正在崛起的路上。个人觉得公司的成功跟行业有很大关系，“风口上的猪”嘛，之前聚美正处风口上，现在自如正处于这个位置，这是我留恋自如的原因。

从技术上来看，PHP 维度：

聚美 PHP 的生态是我见过做的最好的，这里也是 PHP 在国内大规模成熟应用的实例。毕竟作为电商，经历过业务顶峰，沉淀下来的，这是我来聚美的目的。

服务 Worker、连接池、RPC、服务调度、旁路、配置中心、消息中心、任务中心等解决方案，尽管目前我还未吃透这些设计，但是旁路的设计就能给我很赞的感觉。当然，这些都需要一个强大的架构团队来支持。一个互联网公司，只有有了一个好的技术生态，才能更好更快地响应业务需求。

购房

为了承载你的梦想，首先得有个家。而 2018 的楼市，可谓惨不忍睹。全民炒房，全国房价飞涨，多个城市先后出台了摇号政策，才将这一轮炒房热 Hold 住。整个过程，最受伤的就是刚需。

成都楼市，在限购限价的政策下，均价控制在 1.5W 左右，当然现在买房，不光得有钱，还得先摇号。攻略如下：

先确认自己是否有购房资格，主要是户口社保，资格查询工具；
通过房协网、成都摇号助手（小程序）获取最新预售房源，并网上登记报名；
去往登记的售楼部提交纸质资格资料，等待资格审核通过；
等待摇号结果；
摇中后，准备好首付款（首付 3 成），进行按序选房，并办理购房手续；

整个过程，只可意会，不可言传，只有经历了才知道是多么的惊悚。

惊悚场景1：

摇中就像中彩票一样，大部分的摇中概率为 1%。且自己买什么楼盘可选性不大，因为摇中什么才能买什么。

惊悚场景2：

原本以为摇中就好，可没有想到，按序选房是多么的恐怖。因为在仅仅只有一大排房号的数字面前，需要 2 分钟从剩余的房源中选定自己看中的房号，就跟去菜市场买白菜一样。当然，这就需要提前做好功课，比如实地踩点，按优先顺序排出多个中意房号。一切都准备好了，但是你运气不太好，摇中的号靠后就不太可能选上中意的房源。

就摇号买房来说，终于不用拼爹了，而是拼运气。在 5.15 新政之后，这种情况得到改善，但是大学生落户的人就失去了购房资格（所在区社保需满 1 年）。我只是运气刚刚好，赶上新政之前的末班车，摇的号还比较靠前。总之一句话，如果是刚需，就尽快下手，占个坑，因为政策会让你琢磨不透。

未来之城

成都未来的发展，就看这座未来之城——四川天府新区。至于为什么要花大量人力物力打造这座新城？简单的答案是：

成都层面：中心城区“摊拼式”发展，导致中心城区越来越拥挤堵塞，亟需向外疏导人流；
四川层面：需要打造四川经济新的增长极，促进经济高速发展；

接下来就介绍一下这个国家级新区。

规划

四川天府新区规划与 2010 年，2014 年正式成为国家级新区。天府新区建成后，将与成都中心城区形成“双核共兴”的局面。如下为天府新区产业规划图：

我在网上看过一句话，说高新区是民营资本的聚集地，而天府新区是国家队资本的聚集地。我觉得应该说，国家队只是起先导引流作用。

地铁

规划这么美的天府新区，交通自然不能拖了后退。从成都地铁规划图中，可以看到新区地铁覆盖率较高，出行较方便。到 2020 年，开通的地铁有 1、5、6、15、18 号线。

代表建筑和景观

兴隆湖

习大大说，“绿水青山，就是金山银山”。由于优越的地理位置，决定了天府新区一诞生就是一座“公园城市”。兴隆湖作为天府新区的发展起步区，很好地响应了公园城市理念。

一带一路大厦

曾用名为“熊猫大厦”的 676 米超高地标建筑，正式命名为“一带一路大厦”，这也让人们一直铭记住天府新区是“一带一路”战略的一个重要环节。待“一带一路大厦”旁依附的超高建筑群建成后，成都的天际线将进一步提高，也使得成都的天空具有较强的层次感。

独角兽岛

独角兽岛当然是独角兽企业（10 亿美元以上创业公司）的聚集地，建设独角兽岛，体现了成都大力培育独角兽企业的决心。独角兽岛先后分两期建成，一期于 2019 年建成，二期 2019 年开建并于 2022 年建成。

天府国际机场

天府国际机场造型为“太阳神鸟”，位于高新东区简阳芦葭镇，定位为国家级国际航空枢纽。预计到 2020 年建成使用，届时成都即迈入双机场时代，成为中国大陆地区第三个拥有双国际机场的城市。

西博城

中国西部博览城简称西博城，是我国中西部最大的国际会展中心。由于西博城有着铝制的金属外表，使其看起来很有科技感。

如今 4 年过去了，有的规划已初步建成，有的还在如火如荼的建设中，建设者正在一一将规划图变成一座座楼宇，呈现在人们面前。

总结

虽然成都不比北上广深，却是一个可以承载我梦想的地方。在这里，我可以安居乐业，重要的是能守护心中的她。

我的博客发布上线方案 — Hexo

2018-03-03T08:14:00.000Z

之前一直在使用 Hexo 推荐的发布方案，缺点是本地依赖 Hexo 环境，无法随时随地地更新博客。为了摆脱 Hexo 环境约束进而高效写作，有了下述的发布方案。

本文的发布方案中，Git 仓库只是托管 md 文件，通过 Webhook 通知服务器拉取 md 文件，然后执行构建静态文件操作，完成一个发布过程。

我的写作环境为 Typora（Win10），博客发布在阿里云的 ECS（CentOS）上，文章托管在 GitHub。

需求升级

随着时间成本的增高，只能利用碎片时间来进行写作。因此，我的写作场景变成了这样：

习惯使用 MarkDown 写原稿，有 MarkDown 编辑器就行；
写作场地不限定，有电脑就行；
写作时间不确定，有灵感就写；

新的问题

之前（包括 Hexo 推荐）的发布方案，都是先本地编写 MarkDown 源文件，然后本地构建静态文件，最后同步静态文件到服务器。发布流程图如下：

显而易见，若继续使用之前的发布方案，那么每当更换写作场地时都需要安装 Hexo 环境，写作场地和时间都受到限制，不满足需求。

新的方案

问题主要是，本地受制于构建静态文件时需要的 Hexo 环境，那么是否可以将构建静态文件操作放到服务器端？

发布流程

首先，看下新方案的发布流程图：

如流程图所示，整个发布系统共涉及到 3 个环境，分别为本地（写作）、Git 仓库（托管 md 源文件）、服务器（Web 服务）环境。在服务器环境构建静态文件，因此只需要在服务器端安装 Hexo 环境。

一个完整的发布流程包含 3 个部分：

流程 ① ：写作流程；
流程 ② ：发布流程；
流程 ③ ：构建流程；

写作流程

采用按分支开发策略，当写作完成后，只需要 push 修改到对应分支即可。只要有 MarkDown 编辑器，以及任何文本编辑器，甚至马克飞象都可以随时随地写作。

当然，你可能说还需要 Git 环境呀？好吧，如果你是一名合格的 Coder，竟然没有 Git，你知道该干嘛了！再说没有 Git 环境，还可以通过 GitHub 来完成写作。

发布流程

采用 master 发布策略，当需要发布时，需要将对应开发分支 merge 到 master 分支，然后 push master 分支，即可实现发布。

构建流程

这里使用到 Webhook 机制，触发代码更新并部署操作。

当流程 ① 和 ② 结束后，Git 仓库都会向服务器发起一次 HTTP 请求，记录如下：

当收到构建请求后，执行构建操作。构建流程图如下：

首先检查当前变更分支，只有为 master 分支时，执行 pull 操作拉取 md 文件更新，然后再执行 hexo g 完成静态文件的构建。

Webhook脚本

这里直接使用 webhook-cli 工具，只需简单配置即可使用。

新增 hook.json 配置文件，内容如下：

[
  {
    "id": "webhook-deploy-hexo",
    "execute-command": "/build_hexo.sh",
    "include-command-output-in-response": true,
    "trigger-rule":
    {
      "and":
      [
        {
          "match":
          {
            "type": "payload-hash-sha1",
            "secret": "88E7fe7aDf58d8a42108F0b7c2065d55dF3204D7",
            "parameter":
            {
              "source": "header",
              "name": "X-Hub-Signature"
            }
          }
        },
        {
          "match":
          {
            "type": "value",
            "value": "refs/heads/master",
            "parameter":
            {
              "source": "payload",
              "name": "ref"
            }
          }
        }
      ]
    }
  }
]

其中，execute-command 为部署脚本路径，secret 为 webhook 参数加密密钥。

部署脚本 execute-command 的内容如下：

#!/bin/bash

cd /var/www/blog

# 更新代码
git pull

# 生成静态资源
npm install --force
# hexo clean
hexo g

总结

新发布方案与之前方案的区别是：前者只需本地编写 md 文件，博客服务器构建静态文件；后者本地编写 md 文件后，需要本地构建静态文件，然后博客服务器只同步静态文件。

当然，有很多办法可以解决当前问题，比如可以使用持续集成。本文只是提供一个发布思路，在项目的生产环境中，我们也很容易应用上这种发布思路，开发出自己的发布系统。

相关文章 »

启用Hexo开源博客系统（2017-03-01）

Linux日常使用技巧集

2018-02-04T14:00:00.000Z

作为技术人员，Linux 系统可以说是我们使用最多的操作系统，但我们可能并不是很了解它。在这里我将自己日常遇到的 Linux 使用技巧记录下来，方便以后查询使用。

常用命令

统计 IP 连接数

$ netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -rn | head -10

操作系统

查看系统版本

在安装环境或者软件时，我们常常需要知道所在操作系统的版本信息，这里列举几种查看内核和发行版本信息的方法，更多见查看 Linux 系统版本。

内核版本

uname命令

$ uname -a
Linux fhb-6.6 2.6.32-642.13.1.el6.i686

/proc/version文件

$ cat /proc/version 
Linux version 2.6.32-642.13.1.el6.i686

发行版本

lsb_release命令

$ lsb_release -a
LSB Version::base-4.0-ia32:base-4.0-noarch:core-4.0-ia32
Distributor ID:CentOS
Release:6.8

/etc/issue文件

$ cat /etc/redhat-release
CentOS release 6.8 (Final)

启用Swap分区

在遇到内存容量瓶颈时，我们就可以尝试启用 Swap 分区。使用文件（还可以磁盘分区）作为 Swap 分区时，具体步骤如下：

1、创建 Swap 分区的文件

# bs*count为文件大小
$ dd if=/dev/zero of=/root/swapfile bs=1M count=1024

2、格式化为交换分区文件

$ mkswap /root/swapfile

3、启用交换分区

$ swapon /root/swapfile

4、开机自启用 Swap 分区

在/etc/fstab文件中添加如下内容：

/root/swapfile swap swap defaults 0 0

最后，查看系统的 Swap 分区信息：

$ free -h
       total   used    free   shared  buff/cache   available
Mem:   1.7G    729M    252M   9.2M    714M         763M
Swap:  1.0G    0B      1.0G

免密码使用sudo

以下两种需求：

开发中经常会使用到 sudo 命令，为了避免频繁输入密码的麻烦；
脚本中使用到 sudo 命令，怎么输入密码？；

这些，都可以通过将用户加入 sudoers 来解决，当然情况 2 也可以使用echo "passwd"|sudo -S cmd，从标准输入读取密码。

sudoers 配置文件为/etc/sudoers，sudo 命令操作权限配置内容如下：

# 授权用户/组    主机名=（允许转换至的用户）   NOPASSWD:命令动作
root ALL=(ALL) ALL

授权格式说明：

第一个字段为授权用户或组，例如 root；
第二个字段为来源，() 中为允许转换至的用户，= 左边为主机名；
第三个字段为命令动作，多个命令以,号分割；

因此，我的用户为fhb，授权步骤如下：

# 1. 执行visudo命令，操作的文件就是/etc/sudoers
$ sudo visudo
# 2. 追加内容
fhb ALL=(root) NOPASSWD: /usr/sbin/service,/usr/local/php/bin/php,/usr/bin/vim
# 3. Ctrl+O保存并按Enter

然后，使用sudo service ssh restart命令测试 OK。

Yum更新排除指定软件

有时候我们使用 yum 安装的软件，由于配置向后兼容性等问题，我们并不希望这些软件（filebeat 和 logstash）在使用update时，被不经意间被自动更新。这时，可以使用如下方法解决：

临时

通过-x或--exclude参数指定需要排除的包名称，多个包名称使用空格分隔。例如：

# --exclude同样
$ yum -x filebeat logstash update

永久

在 yum 配置文件/etc/yum.conf中，追加exclude配置项。例如：

# 需排序的包名称
exclude=filebeat logstash

再次使用yum update命令，就不会自动更新指定的软件包了。

$ yum update
No Packages marked for Update

ssh

设置禁PING

攻击者可能会通过端口扫面工具，而得出目标服务器监听的端口号，从而进行攻击。通过关闭 Linux 服务器的 ICMP 协议服务或者防火墙拦截 ICMP 协议包，可以达到禁用 ping 的目的。

a. 关闭ICMP服务

$ echo "1" >/proc/sys/net/ipv4/icmp_echo_ignore_all

b. 防火墙拦截

$ iptables -A INPUT -p icmp -j DROP

检查禁 ping 是否成功：

> ping www.fanhaobai.com
请求超时。
请求超时。

修改SSH监听端口

默认情况下，SSH 监听 22 端口，这也使得攻击者可以轻松扫描到目标服务器是否运行 SSH 服务。所以建议将 SSH 端口号更改为大于 1024。

在文件/etc/ssh/sshd_config中，增加如下配置：

Port 22                # 保留22默认端口，防止端口配置失败，无法连接SSH
Port 10086

重启 SSH 服务：

$ service sshd restart
$ netstat -tunpl | grep sshd

Proto Recv-Q Send-Q Local Address  Foreign Address  State    PID/Program name
tcp   0      0      0.0.0.0:10086  0.0.0.0:*        LISTEN   2462/sshd   
tcp   0      0      0.0.0.0:22     0.0.0.0:*        LISTEN   2462/sshd

通过新端口 10086 连接 SSH，如果连接成功再删除默认端口 22 配置。

如果查看发现 10086 已被 sshd 监听，而仍然无法连接 SSH，则需添加防火墙规则：

# -dport指操作端口号
$ iptables -A INPUT -p tcp --dport 10086 -j ACCEPT
# 永久保存iptables规则
$ /etc/rc.d/init.d/iptables save
# 重启iptables
$ /etc/rc.d/init.d/iptables restart

公钥登录

使用密码登录 SSH，每次登录都需要频繁输入密码，所以比较麻烦，使用 SSH 的公钥登录，可以免去输入密码的步骤。

1、在本地主机上生成自己的公钥

$ ssh-keygen

执行命令后出现一系列提示，直接回车即可。会在$HOME/.ssh目录生成公钥和私钥文件，其中id_rsa.pub为你的公钥，id_rsa为你的私钥。

2、配置公钥到远程主机

远程主机将用户的公钥保存在$HOME/.ssh/authorized_keys文件，所以这里需要将上步生成的公钥文件id_rsa.pub的内容追加到authorized_keys文件中。

如果authorized_keys文件不存在，创建即可：

$ mkdir ~/.ssh
$ touch ~/.ssh/authorized_keys

配置 sshd 服务，配置文件为/etc/ssh/sshd_config，将下面内容关闭注释。

RSAAuthentication yes
PubkeyAuthentication yes
AuthorizedKeysFile .ssh/authorized_keys

然后，重启 sshd 服务。

$ service sshd restart

3、免密登录测试

这里通过配置 识别名 ，连接时只需指定连接识别名即可，简单方便。

在$HOME/.ssh目录下创建config文件，并作如下配置：

Host fhb
HostName www.fanhaobai.com
Port 10086
User fhb

使用识别名连接 SSH 登录远程主机，出现如下内容表示公钥登录成功。

$ ssh fhb
Last login: Mon Feb 20 17:09:00 2017 from 103.233.131.130

Welcome to aliyun Elastic Compute Service!

强制踢出其他登录用户

在某些情况下，需要强制踢出系统其他登录用户，比如遇到非法用户登录。查询当前登陆用户：

# 当前用户
$ whoami
root
# 当前所有用户
$ ps -ef | grep 'pts'
root      4752  4727  0 00:09 pts/0    00:00:00 su www
www       4755  4752  0 00:09 pts/0    00:00:00 bash

剔除非法登陆用户：

$ kill -9 4755

更多详细说明，见 Linux 强制踢出其他登录用户。

建立隧道实现端口转发

在可以使用 ssh 情况下，为了能进行线上调试，我们可以使用 ssh 隧道建立端口映射。

例如，线上远程目标机器 ip：10.1.1.123、端口：3303；映射到本地 33031 端口。命令如下：

# [主机ip]:[端口]:[主机ip]:[远程目标机器端口] [远程目标机器ip]
ssh -L 127.0.0.1:33031:127.0.0.1:3303 10.1.1.123

该命令操作后，只能通过127.0.0.1访问。若想全网段访问，需要将第一个主机 ip 更改为0.0.0.0，同时需要在/etc/ssh/sshd_config增加GatewayPorts yes的配置项。

常用工具

Strace调试

在调试程序时，我们会遇到一些系统层面的错误问题，一般都不易发现，这时可以使用 strace 来跟踪系统调用的过程，方便快速定位和解决问题。

$ strace crontab.sh
execve("./crontab.sh", ["./crontab.sh"], [/* 29 vars */]) = 0
brk(0)                                  = 0x106a000
mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7f0434160000
access("/etc/ld.so.preload", R_OK)      = -1 ENOENT (No such file or directory)
open("/etc/ld.so.cache", O_RDONLY)      = 3
fstat(3, {st_mode=S_IFREG|0644, st_size=53434, ...}) = 0
mmap(NULL, 53434, PROT_READ, MAP_PRIVATE, 3, 0) = 0x7f0434152000
close(3)                                = 0
open("/lib64/libc.so.6", O_RDONLY)      = 3
... ...

更多详细说明，见错误调试。

彩色的命令行

在脚本或者代码中，有时候需要在控制终端输出醒目的提示信息，以便引起我们的关注。其实，在 Linux 终端下很容易就能搞定，如下：

实现的源代码，内容为：

echo -e "\033[1;30m Hello World. \033[0m [高亮]"
echo -e "\033[0;31m Hello World. \033[0m [关闭属性]"
echo -e "\033[4;32m Hello World. \033[0m [下划线]"
echo -e "\033[5;33m Hello World. \033[0m [闪烁]"
echo -e "\033[7;34m Hello World. \033[0m [反显]"
echo -e "\033[8;35m Hello World. \033[0m [消隐]"
echo -e "\033[0;36;40m Hello World."
echo -e "\033[0;37;41m Hello World."

\033是 Esc 键对应的 ASCII 码（27=/033=0x1B），表示后面的内容具有特殊含义，类似表述有^[以及/e，而\033[0m表示清除格式控制。

输出格式的规则，可表示为\033[特殊格式;前景色;背景色m，主要分为颜色和格式两类规则。

颜色

主要包括前景色和背景色，前景色范围为30~39，背景色范围为40~49（前景色对应颜色值 +10）。前景色颜色代码表如下：

黑 = "\033[30m"红 = "\033[31m"绿 = "\033[32m"黄 = "\033[33m"蓝 = "\033[34m"紫 = "\033[35m"青 = "\033[36m"白 = "\033[37m"

格式

表达式	格式
\033[0m	关闭所有属性
\033[1m	高亮度
\033[4m	下划线
\033[5m	闪烁
\033[7m	反显
\033[8m	消隐

更新 »

免密码使用 sudo（2018-04-12）
彩色的命令行（2018-08-14）

自如2018新年活动系统 — 抢红包

2018-01-30T00:00:00.000Z

2017 年是自如快速增长的一年，自如客突破 100 万，管理资产达到 50 万间，在年底成功获得了 40 亿 A 轮融资，而这些都要感谢广大的自如客，公司为了回馈自如客，在六周年活动时就发放了 6000 万租住基金，当然年底散币活动也够疯狂。

活动规模

既然公司对自如客这么阔，那对我们员工也得够意思，所以年底我们共准备了 3 个活动。

1、针对自如客的服务费减免活动；
2、针对自如客的 1000 万现金礼包；
3、25 万的员工红包活动；

散币活动 2 和 3 是通过微信红包形式进行，想散币就散吧，可微信告诉我们，想散币还得交税（>﹏<）。员工红包来说，25 万要交掉 10 多万税，此时心疼我的钱。好了，下面开始说点正事。

技术方案

说到红包，我们肯定会想到红包拆分和抢红包两个场景。红包拆分是指将指定金额拆分为指定数目红包的过程，即是用来确定每个红包的金额数；而抢红包就是典型的高并发场景，需要避免红包超发的情况。

红包拆分

可选的方案

拆分方式

1、实时拆分
实时拆分，指的是在抢红包时实时计算每个红包的金额，以实现红包的拆分过程，对系统性能和拆分算法要求较高，例如拆分过程要一直保证后续待拆分红包的金额不能为空，不容易做到拆分红包的金额服从正态分布规律。

2、预先生成
预先生成，指的是在红包开抢之前已经完成了红包的拆分，抢红包时只是依次取出拆分好的红包金额，对拆分算法要求较低，可以拆分出随机性很好的红包金额，通常需要结合队列使用。

拆分算法

我并没有找到业界的通用算法，但红包拆分算法应该是拆分金额要看起来随机，最好能够服从正态分布，可以参考微信和 @lcode 提供的红包拆分算法。

微信拆分算法的优点是算法较简单，拆分效率高，同时，由于该算法天然的特性，可以保证后续红包金额一定不为空，特别适合实时拆分场景，但缺点是会导致大额红包较大概率地在拆分的最后出现。 @lcode 拆分算法的优点是拆分金额基本符合正态分布，适合随机性要求较高的拆分场景。

我们的方案

我们这次的业务对红包金额的随机性要求不高，但是对系统可靠性要求较高，所以我们选用了预算生成方式，使用二倍均值法的红包拆分算法，作为我们的红包拆分方案。

采用预算生成方式，我们预先生成红包并放入 Redis 的 List 中，当抢红包时只是 Pop List 即可，具体实现将在抢红包部分介绍。

拆分算法可以描述为：假设剩余拆分金额为 M，剩余待拆分红包个数为 N，红包最小金额为 1 元，红包最小单位为元，那么定义当前红包的金额为：

$$m = rand(1, floor(M/N*2))$$

其中，floor 表示向下取整，rand(min, max) 表示从 [min, max] 区间随机一个值。$M/N \ast 2$ 表示剩余待拆分金额平均金额的 2 倍，因为 N >= 2，所以 $M/N \ast 2 <= M$，表示一定能保证后续红包能拆分到金额。

代码实现为：

for ($i = 0; $i < $N - 1; $i++) {
    $max = (int)floor($M / ($N - $i)) * 2;
    $m[$i] = $max ? mt_rand(1, $max) : 0;
    $M -= $m[$i];
}

$m[] = $M;

值得一提的是，我们为了保证红包金额差异尽量小，先将总金额平均拆分成 N+1 份，将第 N+1 份红包按照上述的红包拆分算法拆分成 N 份，这 N 份红包加上之前的平均金额才作为最终的红包金额。

抢红包

可选的方案

限流

1、前端限流
前端限制用户在 n 秒之内只能提交一次请求，虽然这种方式只能挡住小白，不过这是 99% 的用户哟，所以也必须得做。

2、后端限流
常用的后端限流方法有漏桶算法和令牌桶算法。漏桶算法主要目的是控制请求数据注入的速率，如果此时漏桶溢出，后续的请求数据会被丢弃。而令牌桶算法是以一个恒定的速度往桶里放入令牌，而如果请求数据需要被处理，则需要先从桶里获取一个令牌，当桶里没有令牌时，这些请求才被丢弃，令牌桶算法的一个好处是可以方便地改变应用接受请求的速率。

防超发

1、库存加锁
可以通过加锁的方式解决资源抢占问题，但是加锁会增加系统开销，大流量下更容易拖垮系统，不过可以尝试一下基于版本号的乐观锁。

2、通过高速队列串行化请求
之所会出现超发问题，是因为并发时会出现多个进程同时获取同一资源的现象，如果使用高速队列将并行请求串行化，那么问题就不存在了。高速队列可以使用 Redis 缓存服务器来实现，当然光使用队列还不够，必要保证整个流程调用链要短、要快，否则队列会积压严重，甚至会拖垮整个服务。

我们的方案

在限流方面，由于我们预估的请求量还在系统承受范围，所以没有考虑引入后端限流方案。我们的抢红包系统流程图如下：

我们将抢红包拆分为红包占有（流程①，同步）和红包发放（流程②，异步）这两个过程，首先采用高速队列串行化请求，红包发放逻辑由一组 Worker 异步去完成。高速队列只是完成红包占有的过程，实现库存的控制，Worker 则处理耗时较长的红包发放过程。

当然，在实际应用中，红包占用过程还需要加上一些前置规则校验，比如用户是否已经领取过，领取次数是否已经达到上限等？红包占有流程图如下：

其中，red::list为 List 结构，存放预先生成的红包金额（流程①中的红包队列）；red::task 也为 List 结构，红包异步发放队列（流程②中的任务队列）；red::draw为 Hash 结构，存放红包领取记录，field为用户的 openid，value为序列化的红包信息；red::draw_count:u:openid为 k-v 结构，用户领取红包计数器。

下面，我将以以下 3 个问题为中心，来说说我们设计出的抢红包系统。

1、怎么保证不超发
我们需要关注的是红包占有过程，从红包占有流程图可看出，这个过程是很多 Key 操作的组合，那怎么保证原子性？可以使用 Redis 事务，但我们选用了 Lua 方案，一方面是因为首先要保证性能，而 Lua 脚本嵌入 Redis 执行不存在性能瓶颈，另一方面 Lua 脚本执行时本身就是原子性的，满足需求。

红包占有的 Lua 脚本实现如下：

-- 领取人的openid为xxxxxxxxxxx
local openid = 'xxxxxxxxxxx'
local isDraw = redis.call('HEXISTS', 'red::draw', openid)
-- 已经领取
if isDraw ~= 0 then
    return true
end
-- 领取太多次了
local times = redis.call('INCR', 'red::draw_count:u:'..openid)
if times and tonumber(times) > 9 then
    return 0
end

local number = redis.call('RPOP', 'red::list')
-- 没有红包
if not number then
    return {}
end
-- 领取人昵称为Fhb,头像为https://xxxxxxx
local red = {money=number,name='Fhb',pic='https://xxxxxxx'}
-- 领取记录
redis.call('HSET', 'red::draw', openid, cjson.encode(red))
-- 处理队列
red['openid'] = openid
redis.call('RPUSH', 'red::task', cjson.encode(red))

return true

需要注意 Lua 脚本执行过程并不是事务的，脚本中的操作命令在执行时是有先后顺序的，当某个操作执行失败时不会回滚已经执行成功的操作，它的原子性是通过单线程模型实现。

2、怎么提高系统响应速度
如红包占有流程图所示，当用户发起抢红包请求时，若有红包则直接完成红包占有操作，同步告知用户是否抢到红包，这个过程要求快速响应。

但由于微信红包支付属于第三方调用，若抢到红包后同步调用红包支付，系统调用链又长又慢，所以红包占有和红包发放异步拆分是必然。拆分后，红包占有只需操作 Redis，响应性能已不是问题。

3、怎么提高系统处理能力
从上述分析可知，目前系统的压力都会集中在红包发放这个环节，因为用户抢到红包时，我们只是同步告知用户已抢到红包，然后异步去发放红包，因此用户并不会立即收到红包（受红包发放 Worker 处理能力和微信服务压力制约）。若红包发放的 Worker 处理能力较弱，那么红包发放的延迟就会很高，体验较差。

如抢红包流程图中所示，我们采用一组 Worker 去消费任务队列，并调用红包支付 API，以及数据持久化操作（后续对账）。尽管红包发放调用链又长又慢，但是注意到这些 Worker 是无状态的，所以可以通过增加 Worker 数量，以横向扩展提高系统的处理能力。

4、怎么保证数据一致性
其实，红包发放延时我们可以做到用户无感知，但是若红包发放（流程②）失败了，已经告知用户抢到红包，但是却木有发，估计他杀人的心都有了。根据 CAP 原理，我们无法同时满足数据一致性、数据可用性、分区耐受性，通常只需做到数据最终一致性。

为了达到数据最终一致性，我们就引入了重试机制，生成一个全局唯一的外部订单号，当某单红包发放失败，就会放回任务队列，使得有机会进行发放重试，当然这一切都需要 API 做幂等处理。

Worker可靠性保障

这里必须将 Worker 可靠性单独说，因为它实在太重要了。Worker 的实现如下：

$maxTask = 1000;
$sleepTime = 1000;

while (true) {
    while ($red = RedLogic::getTask()) {
        RedLogic::doTask($red);
        //处理多少个任务主动退出
        $maxTask--;
        if ($maxTask < 0) {
            return EXIT_CODE_NORMAL;
        }
    }
    //等待任务
    usleep($sleepTime);
}

这里使用 LPOP 命令获取任务，所以使用了 while 结构，并且无任务时需要等待，可以用阻塞命令 BLPOP 来改进。

由于 Worker 需要常驻内存运行，难免会出现异常退出的情况（也有主动退出），所以需要保持 Worker 一直处于运行状态。我们使用进程管理工具 Supervisor 来监控 Worker 的运行状态，同时管理 Worker 的数量，当任务队列出现堆积时，增加 Worker 数量即可。Supervisor 的监控后台如下：

员工系统号散列

公司员工都用唯一一个系统号 emp_code（自增字段）标识，登录成功后返回 emp_code，系统后续所有交互流程都基于 emp_code，分享出去的红包也会携带 emp_code，为了保护员工敏感信息和防止恶意碰撞攻击，我们不能直接将 emp_code 暴露给前端，需要借助一个 token（无规律）的中间者来完成交互。

可选的方案

1、储存映射关系，时时查询
预先生成一个随机串 token，然后跟 emp_code 绑定，每次请求都根据 token 时时查询 emp_code。优点是可以定期更新，相对安全，缺点是性能不高。

2、建立映射关系函数，实时计算
建立一个映射关系函数，如 hash 散列或者加密解密算法，能够根据 emp_code 生成一个无规律的字符串 token，并且要能够根据 token 反映射出 emp_code。优点是需要存储介质存储关系，性能较高，缺点是很难做到定期失效并更新。

我们的方案

由于我们的红包活动只进行几天，所以我们选用了方案 2。对 emp_code 做了 hashids 散列算法，暴露的只是一串无规律的散列字符串。

hashids 是一个开源且轻量的唯一 id 生成器，支持 Java、PHP、C/C++、Python 等主流语言，PHP 想使用 hashids，只需composer require hashids/hashids命令安装即可。

然后，如下方式使用：

use Hashids\Hashids;

$hashids = new Hashids('salt', 6, 'abcdefghijk1234567890');

$hashids->encode(11002);    //994k2kk
$hashids->decode('994k2kk');  //[11002]

需要说明的是，其中salt是非常重要的散列加密盐串，6表示散列值最小长度，abcde...7890为散列字典，太长影响效率，太短不安全。由于默认的散列字典比较长，decode 效率并不高，所以这里移除了大写字母部分。

语音点赞

语音点赞就是用户以语音的形式助力好友，核心技术其实是语音识别，而我们一般都会使用第三方语音识别服务。

可选的方案

1、客户端调用第三方服务识别
客户端直接调用第三方语音识别服务，如微信提供了 JS-SDK 的语音识别 API ，返回识别的语音文本的信息，并且已经经过语义化。优点是识别较快，且不许关注语音存储问题，缺点是不安全，识别结果提交到服务端之前可能被恶意篡改。

2、服务端调用第三方服务识别
先将录制的语音上传至存储平台，然后服务端调用第三方语音识别服务，第三方语音识别服务去获取语音信息并识别，返回识别的语音文本的信息。优点是识别结果较安全，缺点是系统交互较多，识别效率不高。

我们的方案

我们业务场景的特殊性，存在用户可助力次数的限制，所以无需担心恶意刷赞的情况，因此可以选用方案 1，语音识别的交互流程如下：

此时，整个语音识别流程如下：

当然中国文字博大精深，语音识别的文本在匹配时，需要考虑容错处理，可以将文本转化为拼音，然后匹配拼音，或者设置一个匹配百分比，达到匹配值则认为语音口令正确。

需要注意的是，微信只提供 3 天的语音存储服务，若语音播放周期较长，则要考虑实现语音的存储。

其他

红包发放测试

我们使用了线上公账号进行红包发放测试，为了让线上公众号能够授权到测试环境，在线上的微信授权回调地址新增一个参数，将带有to=feature参数的请求引流到测试环境，其他线上流量还是保持不变，匹配规则如下：

# Nginx不支持if嵌套，所以就这样变通实现
set $auth_redirect "";
if ($args ~* "r=auth/redirect") {
    set $auth_redirect "prod";
}
if ($args ~* "to=feature") {
    set $auth_redirect "feature";
}
if ($auth_redirect ~ "feature") {
    rewrite ^(.*)$ http://wx.t.ziroom.com/index.php last;
}
if ($auth_redirect ~ "prod") {
    rewrite ^(.*)$ http://wx.ziroom.com/index.php last;
}

CDN缓存

由于本次活动力度较大，预估流量会比以往增加不少（不能再出现机房带宽打满的情况了，不然 >﹏<），静态页面占流量的很大一部分，所以静态页面在发布时都会放置一份在 CDN 上，这样回源的流量就很小了。

灾备方案

尽管做了很多准备，还是无法确保万无一失，我们在每个关键节点都增加了开关，一点出现异常，通过配置中心可以人工介入做降级处理。

ELK集中式日志平台之三 — 进阶

2017-12-22T15:12:00.000Z

部署 ELK 后，日志平台就搭建完成了，基本上可以投入使用，但是其配置并不完善，也并未提供实时监控和流量分析功能，本文将对 ELK 部署后的一些常见使用问题给出解决办法。

Elasticsearch证书

为了获得 Elasticsearch 更好的体验，我们需要获得 Elastic 的使用授权，安装颁发的永久 License 证书。

首先，前往 registration 地址注册，稍后我们会收到 License 的下载地址：

接着，点击邮件中的地址下载 License 文件，并另存为fan-haobai-dbc3f18c-f87e-40e4-9a1d-f496e58a591e-v5.json：

然后，通过 Elasticsearch 的 API 更新 License：

# 文件名前有@符号
$ curl -XPOST http://127.0.0.1:9200/_xpack/license/start_basic?acknowledge=true -H "Content-Type: application/json" -d @fan-haobai-dbc3f18c-f87e-40e4-9a1d-f496e58a591e-v5.json
# 返回如下信息则成功
{"acknowledged":true,"basic_was_started":true}

通过 Kibana 查看新的证书信息：

Logstash管道进阶

Input

Input 插件指定了 Logstash 事件的输入源，已经支持 beats、kafka、redis 等源的输入。

例如，配置 Beats 源为输入，且端口为 5044：

input {
    beats { port => 5044 }
}

Filter

Filter 插件主要功能是数据过滤和格式化，通过简洁的表达式就可以完成数据的处理。

以下这些配置信息，为插件共有配置：

配置项	类型	描述
add_field	hash	添加字段
add_tag	array	添加标签
remove_field	array	删除字段
remove_tag	array	删除标签

Drop

Drop 插件用来过滤掉无价值的数据，例如过滤掉静态文件日志信息：

if [url] =~ "\.(jpg|jpeg|gif|png|bmp|swf|fla|flv|mp3|ico|js|css|woff)" {
    drop {}
}

Date

我们可以用 Date 插件来格式化时间字段。

例如，将 time 字段值格式化为dd/MMM/YYYY:H:m:s Z形式：

date { match => [ "[time]", "dd/MMM/YYYY:H:m:s Z" ] }

Mutate

Mutate 插件用来对字段进行 rename、replace 、merge 以及字段值 convert、split、join 操作。

例如，将字段@timestamp重命名（rename 或 replace）为 read_timestamp：

mutate { rename => { "@timestamp" => "read_timestamp" } }

以下是对字段值的操作，使用频率较高。

字段值类型转换（convert）

例如，将 response_code 字段值转换为整型：

mutate { convert => { "fieldname" => "integer" } }

字符串分割为数组（split）

例如，将经纬度坐标用数组表示：

mutate { split => { "location" => "," } }

数组合并为字符串（join）

例如，将经纬度坐标合并：

mutate { join => { "location" => "," } }

Kv

Kv 插件能够对 key=value 格式的字符进行格式化或过滤处理，这里只对 field_split 项配置进行说明，更多配置见 Kv Filter Configuration Options。

例如，获取形如?name=cat&type=2GET 请求的参数：

kv { field_split => "&?" }

处理后，将会获取到以下 2 个参数：

name: cat
type: 2

Json

Json 插件当然是用来解析 Json 字符串，而 Json_encode 插件是对字段编码为 Json 字符串。例如，Nginx 日志为 Json 格式，则：

json { source => "message" }

Grok

Grok 插件可以根据指定的表达式结构化文本数据，表达式需形如%{SYNTAX:SEMANTIC}格式，SYNTAX 指定字段值类型，可以为 IP、WORD、DATA、NUMBER 等。

例如，形如55.3.244.1 GET /index.html 15824 0.043的请求日志，则对应的表达式应为%{IP:client} %{WORD:method} %{WORD:request} %{NUMBER:bytes} %{NUMBER:duration}，配置如下：

grok {
    match => { "message" => "%{IP:client} %{WORD:method} %{WORD:request} %{NUMBER:bytes} %{NUMBER:duration}" }
}

经过 Grok 过滤后，输出为：

client: 55.3.244.1
method: GET
request: /index.html
bytes: 15824
duration: 0.043

我们可以使用 Grok Debug 在线调试 Grok 表达式，常用 Nginx、MySQL、Redis 日志的 Grok 表达式见 Configuration Examples 部分。

useragent 插件用来解析用户客户端信息，geoip 插件可以根据 IP 地址解析出用户所在的地址位置，配置较简单，这里不做说明。

Output

Output 插件配置 Logstash 输出对象，可以为 elasticsearch、email、file 等介质。

例如，配置过滤后存储在 Elasticsearch 中：

output {
    elasticsearch {
        hosts => "localhost:9200"
        manage_template => false
        index => "%{[@metadata][type]}-%{+YYYY.MM}"
        document_type => "%{[fields][env]}"
        template_name => "logstash"
        user => "elastic"
        password => "changeme"
    }
}

当然，Output 插件不只是可以将过滤数据输出到一种介质，还可以同时指定多种介质。

配置示例

实现基于 Nginx 日志进行过滤处理，并且通过 useragent 和 geoip 插件获取用户客户端和地理位置信息。详细配置如下：

input {
    beats { port => 5044 }
}
filter {
    if [fileset][module] == "nginx" {
        if [fileset][name] == "access" {
            grok {
                match => { "message" => ["%{IPORHOST:[@metadata][remote_ip]} - %{DATA:[user_name]} \[%{HTTPDATE:[time]}\] \"%{WORD:[method]} %{DATA:[url]} HTTP/%{NUMBER:[http_version]}\" %{NUMBER:[response_code]} %{NUMBER:[body_sent][bytes]} \"%{DATA:[referrer]}\" \"%{DATA:[@metadata][agent]}\""] }
                remove_field => "message"
            }
            grok {
                match => { "referrer" => "%{URIPROTO}://%{URIHOST:referrer_domain}" }
            }
            if [url] =~ "\.(jpg|jpeg|gif|png|bmp|swf|fla|flv|mp3|ico|js|css|woff)" {
                drop {}
            }
            mutate { add_field => { "read_timestamp" => "%{@timestamp}" } }
            date { match => [ "[time]", "dd/MMM/YYYY:H:m:s Z" ] }
            useragent {
                source => "[@metadata][agent]"
                target => "useragent"
            }
            geoip {
                source => "[@metadata][remote_ip]"
                target => "geoip"
            }
        } else if [fileset][name] == "error" {
            grok {
                match => { "message" => ["%{DATA:[time]} \[%{LOGLEVEL:[level]}\] %{POSINT:[pid]}#%{NUMBER:[tid]}: %{GREEDYDATA:[error_message]}(?:, client: %{IPORHOST:[ip]})(?:, server: %{IPORHOST:[server]}?)(?:, request: \"%{WORD:[method]} %{DATA:[url]} HTTP/%{NUMBER:[http_version]}\")?(?:, upstream: %{WORD:[upstream]})?(?:, host: %{QS:[request_host]})?(?:, referrer: \"%{URI:[referrer]}\")?"] }
                remove_field => "message"
            }
            date { match => [ "[time]", "YYYY/MM/dd H:m:s" ] }
        }
    }
}
output {
    elasticsearch {
        hosts => "localhost:9200"
        manage_template => false
        index => "%{[@metadata][type]}-%{+YYYY.MM}"
        document_type => "%{[fields][env]}"
        template_name => "logstash"
    }
}

相对应的 Filebeat 的配置见 filebeat.yml 部分。

索引模板

Logstash 在推送数据至 Elasticsearch 时，默认会自动创建索引，但有时候我们需要定制化索引信息，Logstash 创建的索引就不符合我们的要求，此时就可以使用索引模板来解决。

创建一个名为logstash的索引模板，并指定该索引模板的匹配模式，作为 Logstash 推送日志时索引的模板。

PUT _template/logstash
{
    "index_patterns": ["*access*", "*error*"],
    "settings": {
        "index": {
            "number_of_shards": "3",       
            "number_of_replicas": "0"
        }
    },
    "mappings": {
        "_default_": {
            "properties": {
                "@timestamp": {
                  "type": "date"
                },
                "@version": {
                    "type": "text",
                    "fields": {
                        "keyword": {
                            "type": "keyword",
                            "ignore_above": 256
                        }
                    }
                }
            }
        }
    }
}

其中 index_patterns 为匹配模式，表示含有 access 和 error 的索引才会使用该模板。mappings 为字段映射规则，可以配置更多的字段映射规则，已配置字段根据索引模板规则映射，未配置字段则动态映射。

指定数据存储类型

Logstash 推送数据到 Elasticsearch 时，可以通过以下几种方式指定字段存储类型。

grok

grok {
    match => { "message" => "%{IP:client} %{WORD:method} %{WORD:request} %{NUMBER:bytes} %{NUMBER:duration}" }
}

其中 IP、WORD、NUMBER 分别会映射为 Elasticsearch 的 IP、String、Number 类型。

mutate

通过 Mutate 过滤插件的 convert 配置项，可以转换字段值类型。

mutate { convert => { "fieldname" => "integer" } }

索引模板

若想要根据用户 IP 地址解析后的地理位置信息，得出访问用户的地理分布情况，就需要在 Elasticsearch 中将用户地理坐标存储为 geo_point 类型，而 Logstash 并不能自动完成这个步骤，我们可以在索引模板中指定 location 字段的类型为 geo_point。

Elasticsearch 待存储的地理位置数据，格式如下：

{"geoip": {
  "location": { 
    "lat": 40.722,
    "lon": -73.989
  }
}}

索引模板的 Mappings 部分，应设置为：

{"mappings": {
    "_default_": {
        "properties": {
            "geoip": {
                "type": "object",
                "dynamic": true,
                "properties": {
                    "location": {
                        "type": "geo_point"
                    }
                }
            }
        }
    }
}}

清理过期数据

日志平台会产生大量的索引文件，这样不但会占用磁盘空间，而且还会导致检索性能降低，对于那些已经失效的日志文档，应该定期对其清理。

设置索引过期时间

最简单的办法就是给每个索引设定 TTLs（过期时间），在索引模板中定义失效时间为 7 天：

PUT /_template/logstash
{
    "template": "*",  
    "mappings": {
        "_default_": { "_ttl": { "enabled": true, "default": "7d" } }
    }
}

索引的 TTLs 特性已经从 Elasticsearch 5+ 版本移除，故不推荐使用该方式。

通过查询条件删除文档

例如，日志中时间格式形如"2016-12-24T17:36:14.000Z，则清理 7 天前日志的查询条件为：

{
    "query": {
        "range": { "@timestamp": { "lt": "now-7d", "format": "date_time" } }
    }
}

上述查询中，@timestamp指定查询字段，format指定时间的格式为date_time，now-7d表示当前时间往前推移 7 天的时间。

配置定期清理过期日志的任务：

0 0 * * * /usr/bin/curl -H'Content-Type:application/json' -d'query' -XPOST "host/*/_delete_by_query?pretty" > path.log

其中，query为待清理日志的查询条件，path.log为日志文件路径。

该方式只是删除了过期的日志文档，并不会删除过期的索引信息，适用于对特定索引下的日志文档进行定期清理的场景。

自定义脚本

我们部署日志收集时，通常会以日、月的形式归档建立索引，所以清理过期日志，只需清理过期的索引。

这里通过GET /_cat/indices和DELETE /index?pretty这 2 个 API 完成过期索引的清理，清理脚本如下：

#!/bin/bash
# 待删除索引的正则表达式
SEARCH_PREG="nginx-www-access-20[0-9][0-9](\.[0-9]{2})+"
# 保留索引的天数
KEEP_DAYS=7
URL=http://es.fanhaobai.com
PORT=

date2stamp () {
    date --utc --date "$1" +%s
}

if [ $PORT ]; then elastic_url="$URL:${PORT}"; fi

indices=`curl -u "$USER:$PASSWORD" -s "$URL/_cat/indices?v" | grep -E "$SEARCH_PREG" | awk '{ print $3 }'`
endDate=`date2stamp "$KEEP_DAYS day ago"`

for index in ${indices}; do
  date=`echo $index | sed "s/.*\([0-9]\{4\}\([.\-][0-9]\{2\}\)*\).*/\1/g" | sed 's/[.\-]/-/g'`
  if [ `echo $date | grep -o \- | wc -l` = 1 ]; then date="$date-01"; fi

  currentDate=`date -u "+%Y-%m-%d %T"`
  logDate=`date2stamp $date`

  if [ $(($endDate-$logDate)) -ge 0 ]; then
      echo "[${currentDate}] - ${index} | DELETE";
      curl -u "$USER:$PASSWORD" -XDELETE "$URL/${index}?pretty"
  else
      echo "[${currentDate}] - ${index} | NO";
  fi
done

配置定时任务：

0 0 * * * /usr/local/elk/elasticsearch/bin/delete-index.sh >> /usr/local/elk/elasticsearch/logs/delete-index.log 2>&1

该方式通过自定义脚本方式，可以较灵活的配置所需清理的过期索引，使用起来简洁轻便，但若 Elasticsearch 采用集群方式部署，那么该方式就不是很灵活了。

Curator工具

当遇到清理过期索引比较复杂的场景时，就可以使用官方提供的管理工具 Curator。其不仅可以进行复杂场景的索引管理，还可以进行快照管理，而实现这一切，只需要配置 YAML 格式的配置文件。

安装

这里使用 yum 安装，先配置 yum 源。在/etc/yum.repos.d/目录下创建名为curator.repo的文件，内容如下：

[curator-5]
name=CentOS/RHEL 6 repository for Elasticsearch Curator 5.x packages
baseurl=https://packages.elastic.co/curator/5/centos/6
gpgcheck=1
gpgkey=https://packages.elastic.co/GPG-KEY-elasticsearch
enabled=1

使用 yum 命令安装：

$ rpm --import https://packages.elastic.co/GPG-KEY-elasticsearch
$ yum install -y elasticsearch-curator

# 获取所有索引
$ curator_cli --host es.fanhaobai.com --port 80 show_indices --verbose

.kibana     open   15.7KB       3   1   0 2017-12-15T06:15:07Z

配置

主配置文件

创建名为/etc/curator/curator.yml的配置文件，主要用来配置 Elasticsearch 服务的相关信息：

client:
  hosts:
    - es.fanhaobai.com         #集群配置形如["10.0.0.1", "10.0.0.2"]
  port: 80
  url_prefix:
  use_ssl: false
  certificate:
  client_cert:
  client_key:
  ssl_no_validate: false
  timeout: 30
  master_only: false
logging:
  loglevel: INFO
  logfile: /usr/local/elk/elasticsearch/logs/elasticsearch-curator.log
  logformat: default
  blacklist: ['elasticsearch', 'urllib3']

其中，需要配置 hosts、port、http_auth 这 3 个配置项。

任务配置文件

例如，待清理索引的格式形如test-2017.11.16，需清理 7 天过期的索引。创建名为delete-index.yml的配置文件，内容如下：

actions:
  1:                                  #任务1
   action: delete_indices             #任务动作
   description: "Delete nginx index"  #日志描述
   options:
     ignore_empty_list: false
     disable_action: false
   filters:                           #管道
   - filtertype: pattern              #模式过滤
     kind: prefix                     #匹配索引前缀
     value: test-                     #匹配值，索引前缀为test-
   - filtertype: age                  #时间过滤
     source: name                     #过滤形式
     direction: older                 #往后推算
     timestring: '%Y.%m.%d'           #时间格式，同索引时间格式
     unit: days                       #时间单位
     unit_count: 7                    #时间间隔，7天内

Curator 支持配置多个任务，其中 action 为任务动作，filters 为管道过滤器，filtertype 为过滤器的过滤类型，支持多种过滤类型。

测试删除过期索引：

#删除前
$ curator_cli --config /etc/curator/curator.yml show_indices --verbose | grep test-
test-2017.11.16      open   162.0B       0   3   0 2017-12-17T06:10:04Z
test-2017.12.16      open   486.0B       0   3   0 2017-12-17T05:58:07Z

$ curator --config /etc/curator/curator.yml /etc/curator/delete-index.yml
#删除过期索引后
$ curator_cli --config /etc/curator/curator.yml show_indices --verbose | grep test-
test-2017.12.16      open   486.0B       0   3   0 2017-12-17T05:58:07Z

配置每天执行任务：

0 0 * * * /usr/bin/curator --config /etc/curator/curator.yml /etc/curator/delete-index.yml

该方式不但直接通过配置即可方便实现过期索引的清理，而且可以在复杂场景轻松地管理索引、快照等，故推荐该方式。

数据报表

上述一切准备步骤做好后，我们就可以利用 Kibana 对大量的日志数据进行报表分析，进而实现应用监控和流量分析。

创建索引模式

选择 Kibana 的 ”Managemant >> Kibana >> Index Patterns” 项，创建一个名为nginx-www-access*的索引模式，并设为默认索引，如图：

创建数据图表

选择 Kibana 的 ”Visualize” 项，创建一个数据图表，Kibana 已经支持了丰富的图标类型，这里选择 Line 类型图表制作一个用户访问量的图表。

图表的 Metrics（指标）和 Buckets（桶）属性，Metrics 用来表示 PV 和 UV，而 Buckets 则是时间维度，UV 需要根据 location 去重后统计。

图表的 Metrics 部分，如下图：

图表的 Buckets 部分，如下图：

最后，生成的用户访问量图表如文章起始所示。

创建实时监控面板

当我们创建了各种指标的数据图表后，就可以将这些数据图表组合成一个实时监控面板。选择 Kibana 的 ”Dashboard” 项，创建一个监控面板，并添加所需监控指标的数据图表，拖拽调整各图表到合适位置并保存，一个实时监控面板就呈现在眼前了。

下面是我针对主站 Blog 健康监控和流量分析做出的实时数据报表展示，基本上满足了实时监控要求。

Logstash出现OutOfMemory异常

当 Logstash 运行一段时间后，你可能会发现日志中出现大量的 OutOfMemory 错误，并且服务器 CPU 处于 100% 状态。产生原因是因为 Logstash 堆栈溢出，进而要频繁进行 GC 操作导致。

尽管在安装过程中调整了 Logstash 内存大小，这个由于服务器硬件限制导致的问题还是没法根本解决，但是可以规避问题嘛。很简单，这种堆栈溢出只会长期运行出现，所以只需要定期重启 Logstash 即可。定时任务为：

0 */12 * * * /sbin/service logstash restart

相关文章 »

ELK集中式日志平台之一 — 平台架构（2017-12-16）
ELK集中式日志平台之二 — 部署（2017-12-22）

ELK集中式日志平台之二 — 部署

2017-12-21T15:14:00.000Z

由于系统日志量还在可控范围，所以选择了 ELK+Beats 的方案，并未引入消息队列，当然后续需要可以对系统升级。鉴于此，只需要在日志平台部署 Elasticsearch 和 Logstash 集群，同时在应用服务器部署 Filebeat。

安装前准备

JAVA环境

ELK 需要 JAVA 8 以上的运行环境，若未安装则按如下步骤安装：

# 查看是否安装
$ rpm -qa | grep java
# 批量卸载
$ rpm -qa | grep java | xargs rpm -e --nodeps
$ yum install -y java-1.8.0-openjdk*
$ java -version
openjdk version "1.8.0_151"

在文件/etc/profile配置环境变量：

# 指向安装目录，其中1.8.0.151需与版本号保持一致
JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.151-1.b12.el6_9.x86_64
PATH=$JAVA_HOME/bin:$PATH
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
JAVACMD=/usr/bin/java
export JAVA_HOME JAVACMD CLASSPATH PATH

执行source /etc/profile命令，使配置环境生效。

安装GPG-KEY

由于后续采用 yum 安装，所以需要下载并安装 GPG-KEY：

$ rpm --import https://artifacts.elastic.co/GPG-KEY-elasticsearch

yum 命令会安装最新的版本，若需安装较旧的版本，请先从官方地址下载对应的旧版本 rpm 包，然后使用rpm -ivh命令安装。

Elasticsearch

安装

通过官方地址下载选择最新版本，然后解压：

$ wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.1.1.tar.gz
$ mkdir -p /usr/local/elk
$ tar zxvf elasticsearch-6.1.1.tar.gz -C /usr/local/elk
$ mv /usr/local/elk/elasticsearch-6.1.1 /usr/local/elk/elasticsearch

启动前，需要修改配置文件jvm.options中 JVM 大小，否则可能会内存溢出，导致启动失败。

$ vim config/jvm.options
# 根据实际情况修改
-Xms128m
-Xmx256m

由于 Elasticsearch 新版本不允许以 root 身份启动，因此先创建 elk 用户。这里使用 service 服务方式管理 Elasticsearch，修改启动用户和安装目录。

$ useradd elk
$ chown -R elasticsearch /usr/local/elk/elasticsearch

$ vim /etc/init.d/elasticsearch
ES_HOME="/usr/local/elk/elasticsearch"
MAX_OPEN_FILES=65536
MAX_MAP_COUNT=262144
LOG_DIR="$ES_HOME/logs"
DATA_DIR="$ES_HOME/data"

设置开机启动服务，启动 Elasticsearch，其默认监听 9200 端口。

# 开启服务
$ chkconfig --add elasticsearch
$ chkconfig elasticsearch on

$ service elasticsearch start

$ netstat -tunpl | grep "9200"
tcp   0   0 127.0.0.1:9200   0.0.0.0:*    LISTEN    27029/java
# 获取信息
$ curl http://127.0.0.1:9200

最后，安装使用到的插件：

$ cd /usr/local/elk/elasticsearch
# ingest-geoip和ingest-user-agent分别为ip解析插件和agent解析插件
$ bin/elasticsearch-plugin install ingest-geoip
$ bin/elasticsearch-plugin install ingest-user-agent
# 用户管理和monitor管理
$ bin/elasticsearch-plugin install x-pack

安装 x-pack 插件后，对 Elasticsearch 的操作都需要授权，默认用户名为 elastic，默认密码为 changeme。

Kibana

首先，在/etc/yum.repos.d目录下创建名为kibana.repo的 yum 源文件：

[kibana-5.x]
name=Kibana repository for 5.x packages
baseurl=https://artifacts.elastic.co/packages/5.x/yum
gpgcheck=1
gpgkey=https://artifacts.elastic.co/GPG-KEY-elasticsearch
enabled=1
autorefresh=1
type=rpm-md

使用 yum 命令安装：

$ yum install -y kibana
$ mkdir -p /usr/local/elk
$ ln -s /usr/share/kibana /usr/local/elk/kibana
$ cd /usr/local/elk/kibana

修改配置文件kibana.yml以下配置项：

$ mkdir -p /usr/local/elk/kibana/config
$ mv /etc/kibana/kibana.yml /usr/local/elk/kibana/config
$ vim config/kibana.yml

server.port: 5601                           # 监听端口
server.name: "elk.fanhaobai.com"            # 域名

安装常用插件，例如 x-pack：

$ bin/kibana-plugin install x-pack

Kibana 运行时 NodeJs 默认会最大分配 1G 内存，可以在启动时增加max-old-space-size参数，以限制其运行内存大小：

$ vim bin/kibana

# 增加--max-old-space-size=140参数
NODE_ENV=production exec "${NODE}" $NODE_OPTIONS --max-old-space-size=140 --no-warnings "${DIR}/src/cli" ${@}

修改 init 启动脚本，并启动 Kibana：

$ vim /etc/init.d/kibana

home=/usr/share/kibana
program=$home/bin/kibana
args=-c\\\ $home/config/kibana.yml
# 默认以kibana运行
$ chown -R kibana:kibana /usr/local/elk/kibana/*
$ chkconfig --add kibana
$ chkconfig kibana on
$ service kibana start

配置 Web 服务后，访问 elk.fanhaobai.com 就可以看到 Kibana 强大又绚丽的界面。

安装 x-pack 插件后，访问 Kibana 同样需要授权，且任何 Elasticsearch 的用户名和密码对都可被认证通过。

Logstash

安装

首先，在/etc/yum.repos.d目录下创建logstash.repo文件：

[logstash-5.x]
name=Elastic repository for 5.x packages
baseurl=https://artifacts.elastic.co/packages/5.x/yum
gpgcheck=1
gpgkey=https://artifacts.elastic.co/GPG-KEY-elasticsearch
enabled=1
autorefresh=1
type=rpm-md

使用 yum 安装 Logstash，并测试：

# 安装logstash 5.x
$ yum install -y logstash
# 默认安装路径/usr/share
$ mkdir -p /usr/local/elk
$ ln -s /usr/share/logstash /usr/local/elk/logstash
$ cd /usr/local/elk/logstash
# 命令行测试
$ bin/logstash -e 'input { stdin { } } output { stdout {} }'

The stdin plugin is now waiting for input:
elk
2017-11-21T22:25:07.264Z fhb elk

修改配置文件路径：

$ mv /etc/logstash /usr/local/elk/logstash/config
# 修改文件权限
$ chown -R logstash:logstash /usr/local/elk/logstash

修改 JVM 内存大小，防止出现内存溢出异常：

$ vim config/jvm.options
# 根据实际情况修改
-Xms80m
-Xmx150m

生成并修改 init 启动脚本：

$ bin/system-install /etc/logstash/startup.options sysv
$ vim /etc/init.d/logstash
home=/usr/share/logstash
name=logstash
program=$home/bin/logstash
args=--path.settings\ $home/config
# 添加启动
$ chkconfig --add logstash
$ chkconfig logstash on

安装 x-pack 插件，基本状态信息的监控:

$ bin/logstash-plugin install x-pack

配置

主配置文件

Logstash 主配置文件为config/logstash.yml，配置如下：

path.data: /var/lib/logstash
path.logs: /usr/share/logstash/logs
# 配置
path.config: /usr/share/logstash/config/conf.d

配置管道

创建一个简单的管道（inputs → filters → outputs），配置文件为conf.d/filebeat.conf。日志过滤处理后，直接推送到 Elasticsearch，在 output 部分需配置 Elasticsearch 的用户名和密码。

input {
    beats {
        port => 5044
    }
}

filter {
    if [fileset][name] =~ "access" {
        grok {
            match => {"message" => "%{COMBINEDAPACHELOG}"}
        }
        date {
            match => ["timestamp", "dd/MMM/YYYY:H:m:s Z"]
        }
    } else if [fileset][name] =~ "error" {
    
    } else {
        drop {}
    }
}

output {
    elasticsearch {
        hosts => "localhost:9200"
        manage_template => false
        index => "%{[@metadata][type]}-%{+YYYY.MM}"  #索引名称
        document_type => "%{[fields][env]}"          #文档类型
        user => "elastic"                            #用户名     
        password => "changeme"                       #密码
    }
}

完整配置见配置示例部分，更多配置示例见 Logstash Configuration Examples。

启动

$ service logstash start
# 完成监听
$ netstat -tnpl | grep 5044
tcp   0      0 0.0.0.0:5044     0.0.0.0:*    LISTEN      10132/java

Beats

Filebeat

安装

由于同 Elasticsearch 使用一个源，所以直接使用 yum 安装：

# 安装filebeat 5.6.6
$ yum install -y filebeat
$ mkdir -p /usr/local/elk/beats
$ ln -s /usr/share/filebeat /usr/local/elk/beats/filebeat
$ cd /usr/local/elk/beats/filebeat

修改 init 启动脚本：

$ vim /etc/init.d/filebeat

home=/usr/share/filebeat
pidfile=${PIDFILE-/var/run/filebeat.pid}
agent=${BEATS_AGENT-$home/bin/filebeat}
args="-c $home/filebeat.yml -path.home $home -path.config $home -path.data $home/data -path.logs $home/logs"

配置启动服务：

$ chkconfig --add filebeat
$ chkconfig filebeat on

配置

创建 Filebeat 配置文件filebeat.yml，开启 nginx 日志模块采集 access 日志信息：

filebeat.modules:
- module: nginx
  access:
    enabled: true
    var.paths: ["/data/logs/fanhaobai.com.access.log"] #日志路径
    prospector:
      document_type: nginx-www-access               #Logstash的type字段
  error:
    enabled: true
    var.paths: ["/data/logs/error.log"]
    prospector:
      document_type: nginx-all-error
fields:                                      #自定义字段，Logstash的fields字段
  env: prod                                  #添加环境标识
queue_size: 1000
bulk_queue_size: 0

output.logstash:                             #输出到Logstash
  enabled: true
  hosts: ["localhost:5044"]  
  worker: 1  
  loadbalance: true
  index: 'filebeat'

启动

$ service filebeat start
# 查看推送日志
$ tailf /usr/local/elk/beats/filebeat/bin/logs/filebeat
2017-12-22T02:00:53+08:00 INFO Non-zero metrics in the last 30s: filebeat.harvester.open_files=1 filebeat.harvester.running=1
libbeat.logstash.publish.read_bytes=6 libbeat.logstash.publish.write_bytes=460

Filebeat 启动后，会侦测待采集文件内容是否有增加或更新，并实时推送数据到 Logstash。

因为 Filebeat、Logstash 有些配置并不向后兼容，更新升级后可能导致服务不可用，所以这里在/etc/yum.conf增加exclude=filebeat logstash配置项，禁用yum update的自动更新。

数据呈现

Filebeat 推送到 Logstash 过滤后，Elasticsearch 存储的数据格式为：

{
    "_index": "nginx-www-access-2017.12",
    "_type": "prod",
    "_source": {
        "response_code": "200",
        "ip": "106.11.152.143",
        "offset": 81989257,
        "method": "GET",
        "user_name": "-",
        "input_type": "log",
        "http_version": "1.1",
        "read_timestamp": "2017-12-21T18:12:53.604Z",
        "source": "/data/logs/fanhaobai.com.access.log",
        "fileset": {
            "name": "access",
            "module": "nginx"
        },
        "type": "nginx-www-access",
        "url": "/2017/11/qconf-deploy.html",
        "referrer": "-",
        "@timestamp": "2017-12-21T18:12:53.000Z",
        "@version": "1",
        "beat": {
            "name": "fhb",
            "hostname": "fhb",
            "version": "5.6.5"
        },
        "host": "fhb",
        "body_sent": { "bytes": "44067" },
        "fields": { "env": "prod" }
    }
}

在 Kibana 中呈现效果为：

相关文章 »

ELK集中式日志平台之一 — 平台架构（2017-12-16）
ELK集中式日志平台之三 — 进阶（2017-12-22）

ELK集中式日志平台之一 — 平台架构

2017-12-16T05:14:00.000Z

随着微服务化的推广，我们的应用都会采取分布式方式部署，这就会导致应用日志比较分散，应用监控和排查问题都比较困难，同时效率还低下，集中式日志平台就是为了解决这个问题。

背景

很早前，我们的应用都已经接入了 CAT，能够在线实时查看应用访问量、异常的调用情况等应用性能指标，同时也打通了各平台的调用链路，基本满足应用的性能监控要求。

由于我们应用业务日志并没有推送到 CAT，所以当线上出现问题时，传统方式查看业务日志，排查问题比较困难，搭建业务日志集中平台迫在眉睫。经过调研，我们选择了 Elastic 提供的 ELK 日志解决方案，查看在线演示。

原因主要有两点：

ELK 提供的功能满足我们的使用要求，并有较高的扩展性；
ELK 为一套开源项目，较低的维护成本；

日志平台架构

ELK 集中式日志平台，总体上来说，部署在应用服务器上的数据采集器，近实时收集日志数据推送到日志过滤节点的 Logstash，然后 Logstash 再推送格式化的日志数据到 Elasticsearch 存储，Kibana 通过 Elasticsearch 集中检索日志并可视化。

当然，ELK 集中日志平台也是经过一次次演变，才变成最终的样子。

ES + Logstash + Kibana

最开始的架构中，由 Logstash 承担数据采集器和过滤功能，并部署在应用服务器。由于 Logstash 对大量日志进行过滤操作，会消耗应用系统的部分性能，带来不合理的资源分配问题；另一方面，过滤日志的配置，分布在每台应用服务器，不便于集中式配置管理。

引入Logstash-forwarder

使用该架构，引入 Logstash-forwarder 作为数据采集，Logstash 和应用服务器分离，应用服务器只做数据采集，数据过滤统一在日志平台服务器，解决了之前存在的问题。但是 Logstash-forwarder 和 Logstash 间通信必须由 SSL 加密传输，部署麻烦且系统性能并没有显著提升；另一方面，Logstash-forwarder 的定位并不是数据采集插件，系统不易扩展。

引入Beats

该架构，基于 Logstash-forwarder 架构，将 Logstash-forwarder 替换为 Beats。由于 Beats 的系统性能开销更小，所以应用服务器性能开销可以忽略不计；另一方面，Beats 可以作为数据采集插件形式工作，可以按需启用 Beats 下不同功能的插件，更灵活，扩展性更强。例如，应用服务器只启用 Filebeat，则只收集日志文件数据，如果某天需要收集系统性能数据时，再启用 Metricbeat 即可，并不需要太多的修改和配置。

这种 ELK+Beats 的架构，已经满足大部分应用场景了，但当业务系统庞大，日志数据量较大、较实时时，业务系统就和日志系统耦合在一起了。

引入队列

该架构，引入消息队列，均衡了网络传输，从而降低了网络闭塞，尤其是丢失数据的可能性；另一方面，这样可以系统解耦，具有更好的灵活性和扩展性。

总结

比较成熟的 ELK+Beats 架构，因其扩展性很强，是集中式日志平台的首选方案。在实际部署时，是否引入消息队列，根据业务系统量来确定，早期也可以不引入消息队列，简单部署，后续需要扩展再接入消息队列。

相关文章 »

ELK集中式日志平台之二 — 部署（2017-12-21）
ELK集中式日志平台之三 — 进阶（2017-12-22）

王者编程大赛之五 — 最短路径

2017-12-06T15:14:00.000Z

自如年底就会拥有 50W 间房子，大家知道每间房房子都是需要配置完才能出租给自如客的，整个房租的配置过程是很复杂的，每天都需要大量的物流师傅将家电、家具等物品从仓库送到需要配置的每个房间。

为了能在更多的时间配置更多的房子，我要不断的优化物流从仓库 A 到房间 G 的路径或者仓库 B 到房间 E 的距离，请写出一种算法给你任意图中两点，计算出两点之间的最短距离。
注：A B C D E F G H 都可能是仓库或者房间，点与点之间是距离。

解题思路

该题是求解无向图单源点的最短路径，经常采用 Dijkstra 算法求解，是按路径长度递增的次序产生最短路径。

算法理论

Dijkstra 算法是运用了最短路径的最优子结构性质，最优子结构性质描述为：P(i,j) = {$v_i$,…,$v_k$,…,$v_s$,$v_j$} 是从顶点 i 到 j 的最短路径，顶点 k 和 s 是这条路径上的一个中间顶点，那么 P(k,s) 必定也是从 k 到 s 的最短路径。

由于 P(i,j) = {$v_i$,…,$v_k$,…,$v_s$,$v_j$} 是从顶点 i 到 j 的最短路径，则有 P(i,j) = P(i,k) + P(k,s) + P(k,j)。若 P(k,s) 不是从顶点 k 到 s 的最短路径，那么必定存在另一条从顶点 k 到 s 的最短路径 P’(k,s)，故 P’(i,j) = P(i,k) + P’(k,s) + P(k,j) < P(i,j)，与题目相矛盾，因此 P(k,s) 是从顶点 k 到 s 的最短路径。

算法流程

根据最短路径的最优子结构性质，Dijkstra 提出了以最短路径长度递增，逐次生成最短路径的算法。譬如对于源顶点 $v_0$，首先选择其直接相邻的顶点中最短路径的顶点$v_i$，那么可得从 $v_0$ 到达 $v_j$ 顶点的最短距离 $D[j]=min(D[j], D[j] + matrix[i][j])$（$matrix[i][j]$ 为从顶点 $v_i$ 到 $v_j$ 的直接距离）。

假设存在图 G={V,E}，V 为所有顶点集合，源顶点为 $v_0$，U={$v_0$} 表示求得终点路径的集合，D[i] 为顶点 $v_0$ 到 $v_i$ 的最短距离，P[i] 为顶点 $v_0$ 到 $v_i$ 最短路径上的顶点。

算法描述为：

1）从 V-U 中选择使 D[i] 值最小的顶点 $v_i$，将 $v_i$ 加入到 U 中；
2）更新 $v_i$ 与任一顶点 $v_j$ 的最短距离，即 $D[j]=min(D[j], D[i]+matrix[i][j])$；
3）直到 U=V，便求得从顶点 $v_0$ 到图中任一一点的最短路径；

例如，求 CG 最短路径，算法过程可图示为：

源顶点 $v_0$ = C，顶点与索引关系为 A→H = 0→7，初始时：

U = {false, false, false, false, false, false, false, false}
D = {INF ,INF, 0, INF, INF, INF, INF, INF}
P = { {}, {}, {C}, {}, {}, {}, {}, {} }

将顶点 C 包含至 U 中：

U = {false, false, true, false, false, false, false, false}

更新顶点 C 至任一节点的距离：

D = {6, 9, 0, 11, INF, INF, INF, INF}
P = { {C,A}, {C,B}, {C}, {C,D}, {}, {}, {}, {} }

再选择不在 U 中的最短路径顶点 A，则将 A 包含至 U 中：

U = {true, false, true, false, false, false, false, false}

更新顶点 A 至任一节点的距离：

D = {6, 9, 0, 11, INF, 25, INF, INF}
P = { {C,A}, {C,B}, {C}, {C,D}, {}, {C,A,F}, {}, {} }

继续选择不在 U 中的最短路径顶点 B，则将 B 包含至 U 中：

U = {true, true, true, false, false, false, false, false}

更新顶点 B 至任一节点的距离：

D = {6, 9, 0, 11, 16, 25, INF, INF}
P = { {C,A}, {C,B}, {C}, {C,D}, {C,B,E}, {C,A,F}, {}, {} }

以此类推，直到遍历结束：

U = {true, true, true, true, true, true, true, true}
D = {6, 9, 0, 11, 16, 21, 33, 16}
P = { {C,A}, {C,B}, {C}, {C,D}, {C,B,E}, {C,B,E,F}, {C,B,E,F,G}, {C,D,H} }

因此，CG 的最短距离为 33，最短路径为 C-B-E-F-G。

编码实现

实现的代码如下，并将一一详细说明。

define('MAX', 9999999999);

class Path
{
    //图对应索引数组
    public $indexMatrix = array();
    //顶点与索引映射关系
    public $indexMap = array();
    public $startPoint;
    public $endPoint;
    public $len = 0;
    //最短距离
    public $D = array();
    //已寻找集合
    public $U = array();
    //最短路径
    public $P = array();

    public function __construct(array $matrix, $startPoint, $endPoint)
    {
        $this->indexMap = array_keys($matrix);
        $this->len = count($matrix);

        array_walk($matrix, function(&$value) {
            $value = array_values($value);
        });
        $this->indexMatrix = array_values($matrix);
        $this->startPoint = array_search($startPoint, $this->indexMap);
        $this->endPoint = array_search($endPoint, $this->indexMap);
        
        $this->init();
    }

    public function init()
    {
        for ($i = 0; $i < $this->len; $i++) {
            //初始化距离
            $this->D[$i] = $this->indexMatrix[$this->startPoint][$i] > 0 ? $this->indexMatrix[$this->startPoint][$i] : MAX;
            $this->P[$i] = array();
            //初始化已寻找集合
            if ($i != $this->startPoint) {
                array_push($this->P[$i], $i);
                $this->U[$i] = false;
            } else {
                $this->U[$i] = true;
            }
        }
    }
    
    public function getDistance()
    {
        return $this->D[$this->endPoint];
    }

    public function getPath()
    {
        $path = $this->P[$this->endPoint];
        array_unshift($path, $this->startPoint);

        foreach ($path as &$value) {
            $value = $this->indexMap[$value];
        }

        return $path;
    }
}

Dijkstra 算法求解：

public function dijkstra()
{
    for ($l = 1; $l < $this->len; $l++) {
        $min = MAX;
        //查找距离源点最近的节点{v}
        $v = $this->startPoint;
        for ($i = 0; $i < $this->len; $i++) {
            if (!$this->U[$i] && $this->D[$i] < $min) {
                $min = $this->D[$i];
                $v = $i;
            }
        }
        $this->U[$v] = true;

        //更新最短路径
        for ($i = 0; $i < $this->len; $i++) {
            if (!$this->U[$i] && ($min + $this->indexMatrix[$v][$i] < $this->D[$i])) {
                $this->D[$i] = $min + $this->indexMatrix[$v][$i];
                $this->P[$i] = array_merge($this->P[$v], array($i));
            }
        }
    }
}

接收标准输入处理并输出结果：

//图
$matrix = array(
    'A' => array('A' => MAX, 'B' => 15, 'C' => 6, 'D' => MAX, 'E' => MAX, 'F' => 25, 'G' => MAX, 'H' => MAX),
    'B' => array('A' => 15, 'B' => MAX, 'C' => 9, 'D' => MAX, 'E' => 7, 'F' => MAX, 'G' => MAX, 'H' => MAX),
    'C' => array('A' => MAX, 'B' => 9, 'C' => MAX, 'D' => 11, 'E' => MAX, 'F' => MAX, 'G' => MAX, 'H' => MAX),
    'D' => array('A' => MAX, 'B' => MAX, 'C' => 11, 'D' => MAX, 'E' => 12, 'F' => MAX, 'G' => MAX, 'H' => 5),
    'E' => array('A' => MAX, 'B' => 7, 'C' => 6, 'D' => 12, 'E' => MAX, 'F' => 5, 'G' => MAX, 'H' => 7),
    'F' => array('A' => 25, 'B' => MAX, 'C' => 6, 'D' => MAX, 'E' => 5, 'F' => MAX, 'G' => 12, 'H' => MAX),
    'G' => array('A' => MAX, 'B' => MAX, 'C' => MAX, 'D' => MAX, 'E' => MAX, 'F' => 12, 'G' => MAX, 'H' => 17),
    'H' => array('A' => MAX, 'B' => MAX, 'C' => MAX, 'D' => 5, 'E' => 7, 'F' => 25, 'G' => 17, 'H' => MAX),
);

//CG
while(!$input = trim(fgets(STDIN), " \t\n\r\0\x0B[]"));
$path = new Path($matrix, $input{0}, $input{1});
$path->dijkstra();
echo $path->getDistance(), ' ', implode('-', $path->getPath()), PHP_EOL;

总结

本问题是求无向图源点的最短路径，时间复杂度为 $O(n^2)$，若求解有向图源点的最短路径，只需将相邻顶点的逆向路径置为 ∞，即修改初始图的矩阵。不得不说的是，比求单源点最短路径更加复杂的求某一对顶点的最短路径问题，也可以以每一个顶点为源点使用 Dijkstra 算法求解，但是有更加简洁的 Floyd 算法。

相关文章 »

王者编程大赛之四 — 约瑟夫环

2017-12-06T05:12:00.000Z

每年夏季自如都会组织夏季夏令营活动，给来京参加夏令营的小朋友准备好多礼物，今年也是如此。

组委会准备了一些小游戏来获得这些礼物，其中有一个游戏是这样的：组委会让小朋友围成一个圈。然后随机制定一个数 e，让编号为 0 的小朋友开始报数。每次喊道 e-1 的小朋友直接出列，淘达出局。从本次喊道 e-1 的下一个小朋友开始，继续从 0 报数…e-1 淘汰出局…一直这样进行…最后进行到最后一个小朋友，这位可以拿到”熊帅”亲笔签名的”木木”毛绒玩具。（注：小朋友的编号是从 0 到 n-1 )

示例：
输入：n=1314 e=520
输出：796
输入：n=88888 e=1018
输出：69148

解题思路

该题是一个约瑟夫环问题（猴子选大王），这里运用数学知识找出递推关系式。

假设，总共有 n 个人，数到 k（n >= k）的人被杀掉，幸存者的位置为 $p_n$（为了便于理解，编号从 1 开始）。

易知，初始位置为 k 的人会被第一个杀掉。此时，经过重新排序之后，问题变成了 n-1 个人的情形。幸存者的位置为 $p_{n-1}$。如果能够找到从 $p_{n}$ 到 $p_{n-1}$ 的递推关系，那么问题就解决了。

重新编号后，上一轮相对这一轮每个人位置关系映射为：

1 -> n-k+1
2 -> n-k+2
…
k-1 -> n-1
k+1 -> 1
…
$p_n$ -> $p_{n-1}$
…
n-1 -> n-k+1
n -> n-k

这样，我们就得到一个递推关系式：$p_n = (p_{n-1} + k)$ % $n$，初始条件 $p_1 = 1$（1 个人时幸存者为自己），当然该提递推公式同样适用于 n < k 的情况。

编码实现

约瑟夫环递推实现：

function josephus($n, $e)
{
    $idx = 0;
    for ($i = 2; $i <= $n; $i ++) {
        $idx = ($idx + $e) % $i;
    }
    return $idx;
}

接收标准输入处理并输出结果：

$input = str_replace(' ', '&', $input);
parse_str($input, $arr);
echo josephus($arr['n'], $arr['e']), PHP_EOL;

总结

由于本题只是需要求出最终的幸存者编号，所以可以直接使用递推公式求解，算法时间复杂度为 $O(n)$。若需要模拟整个游戏过程，则需要使用链表模拟实现。

相关文章 »

王者编程大赛之三 — 01背包

2017-12-05T15:12:00.000Z

服务目前每月会对搬家师傅进行评级，根据师傅的评级排名结果，我们将优先保证最优师傅的全天订单。

假设师傅每天工作 8 个小时，给定一天 n 个订单，每个订单其占用时间长为 $T_i$，挣取价值为 $V_i$，现请您为师傅安排订单，并保证师傅挣取价值最大。

输入格式
输入 n 组数据，每组以逗号分隔，并且每一个订单的编号、时长、挣取价值以空格分隔
输出格式
输出争取价值和订单编号，订单编号按照价值由大到小排序，争取价值相同，则按照每小时平均争取价值由大到小排序

示例：
输入：[MV10001 2 100,MV10008 2 30,MV10003 1 200,MV10009 6 500,MV10010 3 400]
输出：730 MV10010 MV10003 MV10001 MV10008
输入：[M10001 2 100,M10002 3 210,M10003 3 300,M10004 2 150,M10005 1 70,M10006 2 220,M10007 1 10,M10008 3 30,M10009 3 200,M10010 2 400]
输出：990 M10010 M10003 M10006 M10005

解题思路

由于本题每个订单每天只被安排一次，是典型地采用动态规划求解的 01 背包问题。

动态规划概念

动态规划过程：每次决策依赖于当前状态，又随即引起状态的转移。一个决策序列就是在变化的状态中产生出来的，所以，这种多阶段最优化决策解决问题的过程就称为动态规划。

动态规划原理：动态规划与分治法类似，都是把原问题拆分成不同规模相同特征的小问题，通过寻找特定的递推关系，先解决一个个小问题，最终达到解决原问题的效果。

建立动态方程

假设，师傅挣取价值最大时的订单为 $x_1$,$x_2$,$x_3$,…,$x_i$（其中 $x_i$ 取 1 或 0，表示第 i 个订单被安排或者不安排），$v_i$ 表示第 i 个订单的价值，$w_i$ 表示第 i 个订单的耗时时长，$wv(i,j)$ 表示安排了第 i 个订单，师傅总耗时为 j 时的最大价值。

可得订单价值和耗时的关系图：

i	1	2	3	4	5
w(i)	2	2	1	6	3
v(i)	100	30	200	500	400

因此，可得动态方程：

$$wv(i,j) = \begin{cases}
wv(i-1,j)(j < w(i)) \
max(wx(i-1,j),wv(i-1,j-w(i))+v(i))(j \geq w(i))
\end{cases}$$

说明：$j

确定边界

可以确定边界条件 $wx(0,j) = wx(i, 0) = 0$，$wx(0,j)$ 表示一个订单都没安排，再怎么耗时价值都为 0，$wx(i,0)$ 表示没有耗时，安排多少订单价值都为 0。

求解

求解过程，可以填表来进行模拟：

如 i=1,j=1 时，有 $j
又如 i=1,j=2 时，有 $j=w(i)$，故 $wx(1,2) = max(wx(1-1,1), wx(1-1,2-w(1)) + v(1) = 100$；
如此下去，直至填到最后一个，i=5,j=8 时，有 $j
在耗时没有超过 8 小时的前提下，当前 5 个订单都被安排过时，$wx(5,8) = 730$ 即为所求的最大价值；

解的组成

尽管求解过程已经求出了最大价值，但是并没有得出哪些订单被安排了，也就是没有得出解的组成部分。

但是在求解的过程中不难发现，寻解方程满足如下定义：

$$x(i) = \begin{cases}
wv(i,j) = wv(i-1,j) \
wv(i,j) \neq wv(i-1,j)
\end{cases}$$

从表格右下到左上为寻解方向，寻解过程如下：

i=5,j=8 时，有 $wv(5,8) != wv(4,8)$，故 $x(5) = 1$，此时 $j -= w(5)$，$j = 5$；
i=4 时，无论 j 取何值，都有 $wv(4,j) == wv(3,j)$，故 $x(5) = 0$，此时 $j = 5$；
i=3,j=5 时，有 $wv(3,5) != wv(2,5)$，故 $x(3) = 1$，此时 $j -= w(3)$，$j = 4$；
i=2,j=4时，有 $wv(2,4) != wv(1,4)$，故 $x(2) = 1$，此时 $j -= w(2)$，$j = 2$；
i=1,j=2时，有 $wv(1,2) != wv(1,2)$，故 $x(1) = 1$，此时 $j -= w(1)$，$j = 0$，寻解结束；

编码实现

实现的代码如下，并将一一详细说明。

class Knapsack
{
    //物品重量,index从1开始表示第1个物品
    public $w = array();
    //物品价值,index从1开始表示第1个物品
    public $v = array();
    //最大价值,$wv[$i][$w]表示前i个物品重量为w时的最大价值
    public $wv = array();
    //物品总数
    public $n = 0;
    //物品总重量
    public $W = 0;
    //背包中的物品
    public $goods = array();

    /**
     * Knapsack constructor.
     * @param array $goods 物品信息,格式如下:
     * [
     *   [index, w, v]   //good1
     *   ...
     * ]
     * @param $c
     */
    public function __construct(array $goods, $c)
    {
        $this->goods = $goods;

        $this->W = $c;
        $this->n = count($goods);
        //初始化物品价值
        $v = array_column($goods, 2);
        array_unshift($v, 0);
        $this->v = $v;
        //初始化物品重量
        $w = array_column($goods, 1);
        array_unshift($w, 0);
        $this->w = $w;
        //初始化最大价值
        $this->wv = array_fill(0, $this->n + 1, array_fill(0, $this->W + 1, 0));

        $this->pd();
        $this->canPut();
    }

    public function getMaxPrice()
    {
        return $this->wv[$this->n][$this->W];
    }
}

动态求解过程：

public function pd()
{
    for ($i = 0; $i <= $this->W; $i++) {
        for ($j = 0; $j <= $this->n; $j++) {
            //未放入物品和重量为空时,价值为0
            if ($i == 0 || $j == 0) {
                continue;
            }

            //决策
            if ($i < $this->w[$j]) {
                $this->wv[$j][$i] = $this->wv[$j - 1][$i];
            } else {
                $this->wv[$j][$i] = max($this->wv[$j - 1][$i], $this->wv[$j - 1][$i - $this->w[$j]] + $this->v[$j]);
            }
        }
    }
}

寻解过程：

public function canPut()
{
    $c = $this->W;
    for ($i = $this->n; $i > 0; $i--) {

        //背包质量为c时,前i-1个和前i-1个物品价值不变,表示第1个物品未放入
        if ($this->wv[$i][$c] == $this->wv[$i - 1][$c]) {
            $this->goods[$i - 1][3] = 0;
        } else {
            $this->goods[$i - 1][3] = 1;
            $c = $c - $this->w[$i];
        }
    }
}

按照订单价值降序获取订单信息（若订单价值相同则按单位时间平均价值降序排列）：

public function getGoods()
{
    $filter = function($value) {
        return $value[3];
    };
    $goods = array_filter($this->goods, $filter);
    usort($goods, function($a, $b) {
        if ($a[2] == $b[2]) {
            if ($a[2] / $a[1] < $b[2] / $b[1]) {
                return 1;
            }
            return 0;
        }
        return $a[2] < $b[2];
    });

    return $goods;
}

接收标准输入处理并输出结果：

$arr = explode(',', $input);
$filter = function ($value) {
    return explode(' ', $value);
};

$knapsack = new Knapsack(array_map($filter, $arr), 8);
$goods = $knapsack->getGoods();

echo $knapsack->getMaxPrice(), ' ', implode(' ', array_column($goods, 0)), PHP_EOL;

总结

该题使用动态规划求解，算法的时间复杂度为 $O(nc)$，当然也可以采用其他方式求解。例如先将订单按照价值排序，然后依次尝试进行安排订单，直至剩余耗时不能再被安排订单。

有关动态规划的其他典型应用，请参考常见的动态规划问题分析与求解一文。

相关文章 »

王者编程大赛之二 — 蓄水池

2017-12-05T14:12:06.000Z

自如寓打算门口用砖头围立一个蓄水池子，从上面看凹凸不平，凹的地方会有积水。那如果用数字代表每个砖头的高度，就形成一个二维数据（如示例），请问这个池子能存储多少单位的水？

例如二维数组为：

9 9 9 9
3 0 0 9
7 8 2 6
时，答案是中间的 0,0 位置可以存储 2（因为其外面最低是 2）个单位的水，因此答案为 2 + 2 = 4。

示例：
输入：[1 1 1 1,1 0 0 1,1 1 1 1]
输出：2
输入：[12 11 12 0 13,12 9 8 12 12,13 10 0 3 15,19 4 4 7 15,19 4 3 0 15,12 13 10 15 13]
输出：58

解题思路

这道题是所有题中困惑我时间最长的题，一开始思维禁锢在想直接通过找到每块砖的四周有效最低砖高度 $H_{min}$，然后这块砖所剩的水为 $w[i][j] = H_{min}+h[i][j]$($h[i][j]$ 为砖的高度，i 和 j 为砖的位置坐标)，因此蓄水池能蓄下的水为 $\sum_{i=1}^n\sum_{j=1}^n w[i][j]$。经过一番尝试，发现寻找某块砖四周最低有效砖逻辑比较复杂，且不易理解，又尝试过使用回溯算法寻找出池子中的所有连通图，但是也未有果。

最后，发现基础平台一位同学的实现思路很清晰，我认为他的实现是最合适的，所以研究了一下。该实现中机智地采用逆向思维，首先往池子注满水（最高砖的高度），然后再通过条件判定每块砖是否需要进行漏水，一直到没有砖需要进行漏水操作。

实现思路如下：

找出高度最高的砖，高度记为 $H_{max}$；
对除去边界的砖进行注水操作，每块砖加水量为 $w[i][j] = H_{max} - h[i][j]$（$h[i][j]$ 为砖的高度）；
对某块砖进行漏水操作，只要这块砖有盛水且上下左右相邻的 4 块砖高度和盛水量之和小于这块砖高度和盛水量之和，则需要进行一次漏水，漏水条件可以描述为 $w[i][j] > 0$ && $h[i][j-1] + w[i][j-1] < h[i][j] + w[i][j]$（该条件为砖左侧相邻的漏水条件，右、上、下同理可得）；
持续漏水操作，一直重复步骤 3 直至没有砖需要进行漏水操作；
求和砖的盛水量，$\sum_{i=1}^n\sum_{j=1}^n w[i][j]$ 即为水池的蓄水量；

算法流程图示如下：

编码实现

实现的代码如下，并将一一详细说明。



class Pool
{
    public $gridArray = array();
    public $maxHeight = 0;
    public $row = 0;
    public $col = 0;

    public function __construct(array $data)
    {
        $this->row = count($data);
        $this->col = count($data[0]);

        foreach ($data as $row => $rowArray) {
            foreach ($rowArray as $col => $height) {
                $height = (int)$height;
                $this->gridArray[$row][$col]['height'] = $height;
                $this->gridArray[$row][$col]['water'] = 0;
                //获取最高砖的高度
                if ($this->maxHeight < $height) {
                    $this->maxHeight = $height;
                }
            }
        }
    }
    
    //判断是否是水池边界
    public function isBorder($row, $col)
    {
        if ($row == 0
            || $row == $this->row - 1
            || $col == 0
            || $col == $this->col - 1
        ) {
            return true;
        }

        return false;
    }

    public function run()
    {
        $this->addWater();

        while ($this->removeWater()) ;

        return $this->collect();
    }
}

注水操作：

public function addWater()
{
    foreach ($this->gridArray as $row => $rowArray) {
        foreach ($rowArray as $col => $grid) {
            if (!$this->isBorder($row, $col)) {
                $this->gridArray[$row][$col]['water'] = $this->maxHeight - $this->gridArray[$row][$col]['height'];
            }
        }
    }
}

漏水操作：

public function removeWater()
{
    foreach ($this->gridArray as $row => $rowArray) {
        foreach ($rowArray as $col => $grid) {
            if ($this->canRemove($row, $col)) {
                return true;
            }
        }
    }

    return false;
}

漏水条件实现如下：

public function canRemove($row, $col)
{
    $can = false;

    if ($this->gridArray[$row][$col]['water'] > 0) {
        //上
        if ($this->gridArray[$row][$col]['water'] + $this->gridArray[$row][$col]['height'] >
            $this->gridArray[$row - 1][$col]['water'] + $this->gridArray[$row - 1][$col]['height']) {
            $this->gridArray[$row][$col]['water'] =
                $this->gridArray[$row - 1][$col]['water'] + $this->gridArray[$row - 1][$col]['height']
                - $this->gridArray[$row][$col]['height'];
            if ($this->gridArray[$row][$col]['water'] < 0) {
                $this->gridArray[$row][$col]['water'] = 0;
            }
            $can = true;
        }
        //右
        if ($this->gridArray[$row][$col]['water'] + $this->gridArray[$row][$col]['height'] >
            $this->gridArray[$row][$col + 1]['water'] + $this->gridArray[$row][$col + 1]['height']) {
            $this->gridArray[$row][$col]['water'] =
                $this->gridArray[$row][$col + 1]['water'] + $this->gridArray[$row][$col + 1]['height']
                - $this->gridArray[$row][$col]['height'];
            if ($this->gridArray[$row][$col]['water'] < 0) {
                $this->gridArray[$row][$col]['water'] = 0;
            }
            $can = true;
        }
        //下
        if ($this->gridArray[$row][$col]['water'] + $this->gridArray[$row][$col]['height'] >
            $this->gridArray[$row + 1][$col]['water'] + $this->gridArray[$row + 1][$col]['height']) {
            $this->gridArray[$row][$col]['water'] =
                $this->gridArray[$row + 1][$col]['water'] + $this->gridArray[$row + 1][$col]['height']
                - $this->gridArray[$row][$col]['height'];
            if ($this->gridArray[$row][$col]['water'] < 0) {
                $this->gridArray[$row][$col]['water'] = 0;
            }
            $can = true;
        }
        //左
        if ($this->gridArray[$row][$col]['water'] + $this->gridArray[$row][$col]['height'] >
            $this->gridArray[$row][$col - 1]['water'] + $this->gridArray[$row][$col - 1]['height']) {
            $this->gridArray[$row][$col]['water'] =
                $this->gridArray[$row][$col - 1]['water'] + $this->gridArray[$row][$col - 1]['height']
                - $this->gridArray[$row][$col]['height'];
            if ($this->gridArray[$row][$col]['water'] < 0) {
                $this->gridArray[$row][$col]['water'] = 0;
            }
            $can = true;
        }
    }

    return $can;
}

持续漏水操作：

public function run()
{
    while ($this->removeWater()) ;
}

求和砖的盛水量：

public function collect()
{
    $sum = 0;
    foreach ($this->gridArray as $row => $rowArray) {
        foreach ($rowArray as $col => $grid) {
            $sum += $grid['water'];
        }
    }

    return $sum;
}

接收标准输入处理并输出结果：

$filter = function ($value) {
    return explode(' ', $value);
};

$pool = new Pool(array_map($filter, explode(',', $input)));
echo $pool->run(), PHP_EOL;

相似题目

Twitter 之前曾经出过类似蓄水池的笔试题，只不过本题是立体水池（二维数组），Twitter 蓄水池笔试题是平面水池（一维数组），解题复杂度也就降低了，当然 Twitter 蓄水池笔试题也可以采用本题的思想来实现，但是时间复杂度为 $O(n^2)$，采用我的Twitter技术面试失败了的实现时间复杂度为 $O(n)$。

实现思路如下：

首先，用两个指针（left 和 right）分别指向数组的第一个元素和最后一个元素，左指针从左向右遍历，右指针从右向左遍历；
初始化数组中一个元素（a[0]）为左边遍历得到的最大值（max_left），最后一个元素（a[a.length-1]）为从右边遍历得到的最大值（max_right）；
开始遍历，遍历结束条件为左指针不小于右指针；
如果左边遍历的最大值小于右边遍历的最大值，说明只要有水沟（即小于左边最大值 max_left 的元素）就会有积水，因为右边的最大值可以保证左边水沟的积水不会流失掉；同样，如果左边遍历的最大值不小于右边遍历的最大值，只要右边有水沟（即小于右边最大值 max_right 的元素）就会有积水；

具体实现，请直接参考 CuGBabyBeaR 文章。

总结

本题的蓄水池问题，如果理解了问题本质并逆向思维，将寻找某块砖四周最低有效砖高度（寻找有效砖涉及到边界扩散）转化为判断某块砖是否需要漏水条件，那么问题就简化很多了，那后续编码也就很容易实现了，本文算法的时间复杂度为 $O(n^3)$。

相关文章 »

王者编程大赛之一

2017-12-04T21:12:06.000Z

本次王者编程大赛分为 3 个组别，分别为研发、测试、移动战场。这里只讨论研发战场所考的题目，本次大赛共有 7 道题，主要考查点为基础算法，解题所用语言不做限制，但是需要在在线验证平台使用标准输入并验证通过，最后成绩以正确性和答题时间为评定依据。

所有题目中第 4 题蓄水池问题，是困惑我时间比较长的，其他题目比较容易看出考察点，这里我给出了 7 道题目自己的实现方式，仅作为解题参考，若你有更好的思路欢迎讨论交流。

本章只叙述前 3 道相对简单的题目，后续题目及解题思路将在王者编程大赛系列中列出。

标准输入过滤

由于采用标准输入进行输入，为了防止输入多余的字符，影响程序执行结果，所以有必要对输入进行过滤处理。

//等待输入并过滤
while(!$input = trim(fgets(STDIN), " \t\n\r\0\x0B[]"));

题1

题目

活动“司庆大放送，一元即租房”，司庆当日，对于签约入住的客户，住满 30 天，返还（首月租金 -1 元）额度的租金卡。租金卡的面额遵循了类似人民币的固定面额（1000 元、500 元、100 元、50 元、20 元、10 元、5 元、1 元），请实现一个算法，给客户返还的租金卡张数是最少的。

示例：
输入（租金卡金额）：54
输出：5
输入（租金卡金额）：9879
输出：20

解题思路

该问题其实就是，对租金卡的金额对题目中所列出的租金卡面额按照从大到小的顺序做商，一直到余数为 0。

编码实现

function getCards($rent) {
    $cardMoney = array(1000, 500, 100, 50, 20, 10, 5, 1);
    $cardNumber = array_fill(0, count($cardMoney), 0);

    $i = 0;
    do {
        $cardNumber[$i] = intval($rent / $cardMoney[$i]);
        $rent = $rent % $cardMoney[$i];
        if ($rent < $cardMoney[$i]) {
            //移动到下一个面额
            $i++;
        }
    } while ($rent);

    return $cardNumber;
}

//输入:54
$card = getCards((int)$input);
echo array_sum($card), PHP_EOL;

题2

题目（排列组合）

2016 年自如将品质管理中心升级为安全与品质管理中心，并开通了自如举报邮箱。请看下边的算式

1 2 3 4 5 6 7 8 9 = 110（举报邮箱前缀数字）;

为了使等式成立，需要在数字间填入加号或者减号（可以不填，但不能填入其它符号）。之间没有填入符号的数字组合成一个数，例如：12 + 34 + 56 + 7 - 8 + 9 就是一种合格的填法。

请大家帮忙计算出多少个可能组合吧，至少 3 个以上算有效。

示例：
输入：[1 2 3 4 5 6 7 8 9]
输出：12 + 34 + 56 + 7 - 8 + 9

解题思路

该题考查点是排列组合问题，待连接的数字已经有序，所以只需要确定相邻两个数字的连接符即可。假设待连接数字的长度为 n，那么问题可以描述为，将空格、+、- 这 3 种连接符插入到 n-1 个相邻待连接数字之间的位置，所以共有 3^n-1 种情况，然后判断每种情况的计算结果是否为等式右边的数字。

为了获取 3 种连接符组成的 3^n-1 种组合情况，这里巧妙地运用 3 进制运算来实现。

算法执行流程：

编码实现

实现代码如下，并将一一详细说明。


class Rank
{
    public $data = array();
    public $operate = array('', '-', '+');
    public $originLen = 0;
    public $sum = 0;

    public function __construct(array $data, $sum)
    {
        $this->originLen = count($data);
        $this->sum = $sum;

        foreach ($data as $k => $value) {
            $this->data[$k*2] = $value;
        }
    }
}

3 进制运算的实现，注意需要对高位进行补 0 的操作，其中 number 为 3^n-1（组合情况）。

public function ternary($number)
{
    $pos = 2 * $this->originLen - 3;

    do {
        $mod = $number % 3;
        $number = (int)($number / 3);
        $this->data[$pos] = $this->operate[$mod];
        $pos -= 2;
    } while($number);
    //高位补0
    while ($pos > 0) {
        $this->data[$pos] = $this->operate[0];
        $pos -= 2;
    }

    ksort($this->data);
}

对 3 种连接符组成 3^n-1 种组合，根据等式成立情况进行取舍：

public function run()
{
    $result = array();
    $times = pow(3, $this->originLen - 1);
    for ($i = 0; $i < $times; $i++) {
        //模拟3进制的运算
        $this->ternary($i);
        //决策
        $str = implode('', $this->data);
        if (eval("return $str;") == $this->sum) {
            $result[] = $str;
        }
    }

    return $result;
}

接收标准输入并输出结果：

//输入:[1 2 3 4 5 6 7 8 9]
$rank = new Rank(explode(' ', $input), 110);
array_walk($rank->run(), function($value) {
    echo $value, PHP_EOL;
});

题3

题目（排序）

给定一个所有元素为非负的数组，将数组中的所有数字连接起来，求最大的那个数。

示例：
输入：4,94,9,14,1
输出：9944141
输入：121,89,98,15,4,3451
输出：98894345115121

解题思路

这道题是我司的笔试题目之一，我之前写的《求非负数组元素组成的最大字符串》文章，已经有过实现过程的描述。当然这道题可能有很多种实现方式，但是我认为最合适的实现还是采用排序的方式，容易理解，实现也简洁。

比较规则：分析 a 和 b 的排列，因为这 2 个数存在 2 种排列情况，既 a_b 和 b_a，若 a_b 组合值大于 b_a 组合，那么认为 a “大于” b，则 a 需要排列在 b 前面，反之则需要交换 a 和 b 的位置。同我们熟悉的排序算法唯一不同的是，这里不是直接通过比较 2 个元素值大小，而是需要通过排列后的 2 个新值进行大小比较。
排序算法：由于只是比较规则的不同，所以常用的排序算法（冒泡、快速、堆）一样适用。

这里使用冒泡排序来进行说明，每一趟找出待排序元素的最小值，算法执行流程如下：

编码实现

定义比较规则，ab 和 ba 组合后的数字进行值大小的比较：

function cmp($a, $b) {
    if ($a == $b) {
        return 0;
    }
    return $a . $b > $b . $a ? -1 : 1;
}

接收输入并输出结果：

function array_form_max_str(array $Arr) {
    foreach ($Arr as $value) {
        if ($value < 0) {
            return '';
        }
    }

    usort($Arr, "cmp");
    //拼接
    return implode('', $Arr);
}

//输入:4,94,9,14,1
echo array_form_max_str(explode(',', $input)), PHP_EOL;

总结

这 3 道题算是热身吧，第 2 题巧妙运用 3 进制运算来模拟排列情况，都相对较容易，只是实现方式你是否会在意优雅而已。虽然简单，但是也不建议一上来就开始编码，首先要想清楚解题思路，然后编码实现即可。

相关文章 »

异步、并发、协程原理

2017-11-13T02:45:30.000Z

原文：http://wiki.phpboy.net/doku.php?id=2017-07:55-异步_并发_协程原理.md

Linux 操作系统在设计上将虚拟空间划分为用户空间和内核空间，两者做了隔离是相互独立的，用户空间给应用程序使用，内核空间给内核使用。

一、异步

应用程序和内核

内核具有最高权限，可以访问受保护的内存空间，可以访问底层的硬件设备。而这些是应用程序所不具备的，但应用程序可以通过调用内核提供的接口来间接访问或操作。所谓的常见的 IO 模型就是基于应用程序和内核之间的交互所提出来的。以一次网络 IO 请求过程中的 read 操作为例，请求数据会先拷贝到系统内核的缓冲区（内核空间），再从操作系统的内核缓冲区拷贝到应用程序的地址空间（用户空间）。而从内核空间将数据拷贝到用户空间过程中，就会经历两个阶段：

等待数据准备
拷贝数据

也正因为有了这两个阶段，才提出了各种网络 I/O 模型。

Unix/Linux的体系架构

同步和异步

同步（Synchronised）和异步（Asynchronized）的概念描述的是应用程序与内核的交互方式，同步是指应用程序发起 I/O 请求后需要等待或者轮询内核 I/O 操作完成后才能继续执行；而异步是指应用程序发起 I/O 请求后仍继续执行，当内核 I/O 操作完成后会通知应用程序，或者调用应用程序注册的回调函数。

阻塞和非阻塞

阻塞和非阻塞的概念描述的是应用程序调用内核 IO 操作的方式，阻塞是指 I/O 操作需要彻底完成后才返回到用户空间；而非阻塞是指 I/O 操作被调用后立即返回给用户一个状态值，无需等到 I/O 操作彻底完成。

常见的网络I/O模型大概有四种：

同步阻塞IO（Blocking IO）
同步非阻塞IO（Non-blocking IO）
IO多路复用（IO Multiplexing）
异步IO（Asynchronous IO）

IO多路复用

多路 I/O 复用模型是利用 select、poll、epoll 可以同时监察多个流的 I/O 事件的能力，在空闲的时候，会把当前线程阻塞掉，当有一个或多个流有 I/O 事件时，就从阻塞态中唤醒，于是程序就会轮询一遍所有的流（epoll 是只轮询那些真正发出了事件的流），并且只依次顺序的处理就绪的流，这种做法就避免了大量的无用操作。这里“多路”指的是多个网络连接，“复用”指的是复用同一个线程。采用多路 I/O 复用技术可以让单个线程高效的处理多个连接请求（尽量减少网络 IO 的时间消耗）。** IO 多路复用是异步阻塞的。**

二、并发

并发，在操作系统中，是指 一个时间段 中有几个程序都处于已启动运行到运行完毕之间，且这几个程序都是在同一个处理机上运行，但任一个时刻点上只有一个程序在处理机上运行。

并发和并行的区别：

并发（concurrency）：逻辑上具备同时处理多个任务的能力。
并行（parallesim）：物理上在同一时刻执行多个并发任务，依赖多核处理器等物理设备。

多线程或多进程是并行的基本条件，但单线程也可用协程做到并发。通常情况下，用多进程来实现分布式和负载平衡，减轻单进程垃圾回收压力；用多线程抢夺更多的处理器资源；用协程来提高处理器时间片利用率。现代系统中，多核 CPU 可以同时运行多个不同的进程或者线程。所以并发程序可以是并行的，也可以不是。

三、协程

在了解协程前先了解一些概念：

1、线程模型

在现代计算机结构中，先后提出过两种线程模型：用户级线程（user-level threads）和内核级线程（kernel-level threads）。所谓用户级线程是指，应用程序在操作系统提供的单个控制流的基础上，通过在某些控制点（比如系统调用）上分离出一些虚拟的控制流，从而模拟多个控制流的行为。由于应用程序对指令流的控制能力相对较弱，所以，用户级线程之间的切换往往受线程本身行为以及线程控制点选择的影响，线程是否能公平地获得处理器时间取决于这些线程的代码特征。而且，支持用户级线程的应用程序代码很难做到跨平台移植，以及对于多线程模型的透明。用户级线程模型的优势是线程切换效率高，因为它不涉及系统内核模式和用户模式之间的切换；另一个好处是应用程序可以采用适合自己特点的线程选择算法，可以根据应用程序的逻辑来定义线程的优先级，当线程数量很大时，这一优势尤为明显。但是，这同样会增加应用程序代码的复杂性。有一些软件包（如 POSIXThreads 或 Pthreads 库）可以减轻程序员的负担。

内核级线程往往指操作系统提供的线程语义，由于操作系统对指令流有完全的控制能力，甚至可以通过硬件中断来强迫一个进程或线程暂停执行，以便把处理器时间移交给其他的进程或线程，所以，内核级线程有可能应用各种算法来分配处理器时间。线程可以有优先级，高优先级的线程被优先执行，它们可以抢占正在执行的低优先级线程。在支持线程语义的操作系统中，处理器的时间通常是按线程而非进程来分配，因此，系统有必要维护一个全局的线程表，在线程表中记录每个线程的寄存器、状态以及其他一些信息。然后，系统在适当的时候挂起一个正在执行的线程，选择一个新的线程在当前处理器上继续执行。这里“适当的时候”可以有多种可能，比如：当一个线程执行某些系统调用时，例如像 sleep 这样的放弃执行权的系统函数，或者像 wait 或 select 这样的阻塞函数；硬中断（interrupt）或异常（exception）；线程终止时，等等。由于这些时间点的执行代码可能分布在操作系统的不同位置，所以，在现代操作系统中，线程调度（thread scheduling）往往比较复杂，其代码通常分布在内核模块的各处。

内核级线程的好处是，应用程序无须考虑是否要在适当的时候把控制权交给其他的线程，不必担心自己霸占处理器而导致其他线程得不到处理器时间。应用线程只要按照正常的指令流来实现自己的逻辑即可，内核会妥善地处理好线程之间共享处理器的资源分配问题。然而，这种对应用程序的便利也是有代价的，即，所有的线程切换都是在内核模式下完成的，因此，对于在用户模式下运行的线程来说，一个线程被切换出去，以及下次轮到它的时候再被切换进来，要涉及两次模式切换：从用户模式切换到内核模式，再从内核模式切换回用户模式。在 Intel 的处理器上，这种模式切换大致需要几百个甚至上千个处理器指令周期。但是，随着处理器的硬件速度不断加快，模式切换的开销相对于现代操作系统的线程调度周期（通常几十毫秒）的比例正在减小，所以，这部分开销是完全可以接受的。

除了线程切换的开销是一个考虑因素以外，线程的创建和删除也是一个重要的考虑指标。当线程的数量较多时，这部分开销是相当可观的。虽然线程的创建和删除比起进程要轻量得多，但是，在一个进程内建立起一个线程的执行环境，例如，分配线程本身的数据结构和它的调用栈，完成这些数据结构的初始化工作，以及完成与系统环境相关的一些初始化工作，这些负担是不可避免的。另外，当线程数量较多时，伴随而来的线程切换开销也必然随之增加。所以，当应用程序或系统进程需要的线程数量可能比较多时，通常可采用线程池技术作为一种优化措施，以降低创建和删除线程以及线程频繁切换而带来的开销。

在支持内核级线程的系统环境中，进程可以容纳多个线程，这导致了多线程程序设计（multithreaded programming）模型。由于多个线程在同一个进程环境中，它们共享了几乎所有的资源，所以，线程之间的通信要方便和高效得多，这往往是进程间通信（IPC，Inter-Process Communication）所无法比拟的，但是，这种便利性也很容易使线程之间因同步不正确而导致数据被破坏，而且，这种错误存在不确定性，因而相对来说难以发现和调试。

2、什么是协同式和抢占式？

许多协同式多任务操作系统，也可以看成协程运行系统。说到协同式多任务系统，一个常见的误区是认为协同式调度比抢占式调度“低级”，因为我们所熟悉的桌面操作系统，都是从协同式调度（如 Windows 3.2， Mac OS 9 等）过渡到抢占式多任务系统的。实际上，调度方式并无高下，完全取决于应用场景。抢占式系统允许操作系统剥夺进程执行权限，抢占控制流，因而天然适合服务器和图形操作系统，因为调度器可以优先保证对用户交互和网络事件的快速响应。当年 Windows 95 刚刚推出的时候，抢占式多任务就被作为一大买点大加宣传。协同式调度则等到进程时间片用完或系统调用时转移执行权限，因此适合实时或分时等等对运行时间有保障的系统。

另外，抢占式系统依赖于 CPU 的硬件支持。因为调度器需要“剥夺”进程的执行权，就意味着调度器需要运行在比普通进程高的权限上，否则任何“流氓（rogue）”进程都可以去剥夺其他进程了。只有 CPU 支持了执行权限后，抢占式调度才成为可能。x86 系统从 80386 处理器开始引入 Ring 机制支持执行权限，这也是为何 Windows 95 和 Linux 其实只能运行在 80386 之后的 x86 处理器上的原因。而协同式多任务适用于那些没有处理器权限支持的场景，这些场景包含资源受限的嵌入式系统和实时系统。在这些系统中，程序均以协程的方式运行。调度器负责控制流的让出和恢复。通过协程的模型，无需硬件支持，我们就可以在一个“简陋”的处理器上实现一个多任务的系统。我们见到的许多智能设备，如运动手环，基于硬件限制，都是采用协同调度的架构。

协程基本概念

“协程”（Coroutine）概念最早由 Melvin Conway 于 1958 年提出。协程可以理解为纯用户态的线程，其通过协作而不是抢占来进行切换。相对于进程或者线程，协程所有的操作都可以在用户态完成，创建和切换的消耗更低。总的来说，协程为协同任务提供了一种运行时抽象，这种抽象非常适合于协同多任务调度和数据流处理。在现代操作系统和编程语言中，因为用户态线程切换代价比内核态线程小，协程成为了一种轻量级的多任务模型。

从编程角度上看，协程的思想本质上就是控制流的主动让出（yield）和恢复（resume）机制，迭代器常被用来实现协程，所以大部分的语言实现的协程中都有 yield 关键字，比如 Python、PHP、Lua。但也有特殊比如 Go 就使用的是通道来通信。

有趣的是协程的历史其实要早于线程。

WIKI 的解释：

Coroutines are computer program components that generalize subroutines for non-preemptive multitasking, by allowing multiple entry points for suspending and resuming execution at certain locations. Coroutines are well-suited for implementing more familiar program components such as cooperative tasks, exceptions, event loop, iterators, infinite lists and pipes.

进程、线程、协程的特点及区别

进程（process）

进程是资源分配的最小单位
进程间不共享内存，每个进程拥有自己独立的内存
进程间可以通过信号、信号量、共享内存、管道、队列等来通信
新开进程开销大，并且 CPU 切换进程成本也大
进程由操作系统调度
多进程方式比多线程更加稳定

线程（thread）

线程是程序执行流的最小单位
线程是来自于进程的，一个进程下面可以开多个线程
每个线程都有自己一个栈，不共享栈，但多个线程能共享同一个属于进程的堆
线程因为是在同一个进程内的，可以共享内存
线程也是由操作系统调度，线程是 CPU 调度的最小单位
新开线程开销小于进程，CPU 在切换线程成本也小于进程
某个线程发生致命错误会导致整个进程崩溃
线程间读写变量存在锁的问题处理起来相对麻烦

协程（coroutine）

对于操作系统来说只有进程和线程，协程的控制由应用程序显式调度，非抢占式的
协程的执行最终靠的还是线程，应用程序来调度协程选择合适的线程来获取执行权
切换非常快，成本低。一般占用栈大小远小于线程（协程 KB 级别，线程 MB 级别），所以可以开更多的协程
协程比线程更轻量级

** 不同模型下用户空间与内核空间的关系：**

注：协程可以理解为上图中的用户级线程模型。

支持协程的语言

Simula
Modula-2
C#
Lua
Go
JavaScript(ECMA-262 6th Edition)
Python
Ruby
Erlang
PHP（PHP5.5+）
…

C协程

C 标准库里的函数 setjmp 和 longjmp 可以用来实现一种协程。

Go协程

Go 语言是原生支持语言级并发的，这个并发的最小逻辑单元就是 goroutine。goroutine 就是 Go 语言提供的一种用户态线程，当然这种用户态线程是跑在内核级线程之上的。当我们创建了很多的 goroutine，并且它们都是跑在同一个内核线程之上的时候，就需要一个 调度器（scheduler）来维护这些 goroutine，确保所有的 goroutine 都使用 CPU，并且是尽可能公平的使用 CPU 资源。Go 的 scheduler 比较复杂，它实现了 M:N 的模式。M:N 模式指的是多个 goroutine 在多个内核线程上跑，Go 的 scheduler 可参考>>。goroutine 让 Go 低成本地具有了高并发运算能力。另外 Go 协程是通过通道（channel）来通信的。

注意：goroutine 的实现并不完全是传统意义上的协程。在协程阻塞的时候（CPU 计算或者文件 IO 等），多个 goroutine 会变成多线程的方式执行。

func main() {
    for i := 0; i < 100; i++ {
        go func() { // 启动一个goroutine
            fmt.Println(i)
        }()
    }
}

Python协程

Python 协程基于 Generator。Python 实现的 grep 例子：

def grep(pattern):
    while True:
        line = (yield)
        if pattern in line:
             print(line)

search = grep('coroutine')
next(search) # 启动一个协程
search.send("send sha ne")

Lua协程

Lua 中的协同是一协作的多线程，每一个协同等同于一个线程，yield-resume 可以实现在线程中切换。然而与真正的多线程不同的是，协同是非抢占式的。当程序运行到 yield 的时候，使用协程将上下文环境记录住，然后将程序操作权归还到主函数，当主函数调用 resume 的时候，会重新唤起协程，读取 yield 记录的上下文。这样形成了程序语言级别的多协程操作。

co = coroutine.create(  -- 创建coroutine
    function(i)
        print(i);
    end
)

coroutine.resume(co, 1)  -- 唤醒coroutine
print(coroutine.status(co))  -- 查看coroutine的状态

co = coroutine.wrap(
    function(i)
        print(i);
    end
)

co(1)

co2 = coroutine.create(
    function()
        for i=1,10 do
            print(i)
            if i == 3 then
                print(coroutine.status(co2)) 
                print(coroutine.running()) -- 返回正在跑的coroutine
            end
            coroutine.yield() -- 挂起coroutine
        end
    end
)

PHP协程

PHP 5.5 一个比较好的新功能是加入了对迭代生成器和协程的支持。PHP 协程也是基于 Generator，Generator 可以视为一种“可中断”的函数，而 yield 构成了一系列的“中断点”。PHP 协程没有 resume 关键字，而是“在使用的时候唤起”协程。

function xrange($start, $end, $step = 1) {
    for ($i = $start; $i <= $end; $i += $step) {
        yield $i;
    }
}

foreach (xrange(1, 1000000) as $num) { // xrange返回的是一个Generator对象
    echo $num, "\n";
}

Swoole 在 2.0 开始内置协程（Coroutine）的能力，提供了具备协程能力 IO 接口（统一在命名空间Swoole\Coroutine*）。基于 setjmp、longjmp 实现，在进行协程切换时会自动保存 Zend VM 的内存状态（主要是 EG 全局内存和 vm stack）。

由于 Swoole 是在底层封装了协程，所以对比传统的 PHP 层协程框架，开发者不需要使用 yield 关键词来标识一个协程 IO 操作，所以不再需要对 yield 的语义进行深入理解以及对每一级的调用都修改为 yield。

适合使用协程的场景

协程适合于 IO 密集型场景，这样能提高并发性，比如请求接口、Mysql、Redis 等的操作；
PHP 中利用协程还可以低成本处理处理大数据集合。参考>>；
替代异步回调的代码风格；（协程令开发者可以无感知的用同步的代码编写方式达到异步 IO 的效果和性能，避免了传统异步回调所带来的离散的代码逻辑和陷入多层回调中导致代码无法维护。但相比普通的异步回调程序，协程写法会多增加额外的内存占用和一些 CPU 开销。）

四、协程与异步和并发的联系

协程与异步：协程并不是说替换异步，协程一样可以利用异步实现高并发。

协程与并发：协程要利用多核优势就需要比如通过调度器来实现多协程在多线程上运行，这时也就具有了并行的特性。如果多协程运行在单线程或单进程上也就只能说具有并发特性。

五、引用

相关文章 »

用PHP玩转进程之一 — 基础（2018-08-28）
用PHP玩转进程之二 — 多进程PHPServer （2018-09-02）

分布式配置管理Qconf

2017-11-03T09:32:27.000Z

原文：从配置文件到分布式配置管理QConf

QConf 是奇虎 360 广泛使用的配置管理服务，现已开源 QConf Source Code，欢迎大家关注使用。本文从设计初衷，架构实现，使用情况及相关产品比较四个方面进行介绍。

设计初衷

在分布式环境中，出于负载、容错等种种原因，几乎所有的服务都需要在不同的机器节点上部署多个实例。同时，业务项目中总少不了各种类型的配置文件。这种情况下，有时仅仅是一个配置内容的修改，便需要重新进行代码提交 git，打包，分发上线的流程。当部署的机器有很多时，分发上线本身也是一个很繁杂的工作。而配置文件的修改频率又远远大于代码本身。追本溯源，我们认为所有的这些麻烦是由于我们对配置和代码在管理和发布过程中不加区分造成的。配置本身源于代码，是为了提高代码的灵活性而提取出来的一些经常变化的或需要定制的内容，而正是配置的这种天生的变化特征给我们带了很大的麻烦。因此，我们开发了分布式配置管理系统 QConf，并依托 QConf 在 360 内部提供了一整套配置管理服务，QConf 致力于将配置内容从代码中完全分离出来，及时可靠高效地提供配置访问和更新服务。

整体认识

为了让大家对之后的内容有个直观的认识，先来介绍一下如果需要在自己的项目中使用 QConf 应该怎么做：

首先，部署 QConf，QConf 采用 cmake 构建，依次执行如下命令。

cmake
..
make && make install

之后，通过 Zookeeper 客户端或 QConf 管理界面 在 Zookeeper 上建立自己的节点结构，节点完整路径作为 QConf 的 key 值，以 360 公司内部 QConf 管理界面为例：

最后，选择所需语言版本的 QConf 库，并在需要获得配置内容的代码位置，直接调用 Qconf 客户端接口，并放心每次取得的都是最新鲜出炉的配置内容。

需要说明的是，使用 QConf 后已经没有所谓的配置文件的概念，你要做的就是在需要的地方获取正确的内容，QConf 认为，这才是你真正想要的。

架构介绍

了解了 QConf 的设计初衷和使用方式，相信大家已经对 QConf 有一个整体的认识并且对其实现有了大概的猜想。在介绍架构之前，还需要申明一下 QConf 对配置信息的定位，因为这个定位直接决定了其结构设计和组件选择。

单条数据量小
更新频繁（较代码而言）
配置总数可能巨大，但单台机器关心配置数有限
读多写少

进入主题，开始介绍 QConf 的架构实现：

上图展示的是 QConf 的基本结构，从角色上划分主要包括 QConf 客户端，QConf 服务端和 QConf 管理端。

QConf服务端

QConf 使用 ZooKeeper 集群作为服务端提供服务。众所周知，ZooKeeper 是一套分布式应用程序协调服务，根据上面提到的对配置内容的定位，我们认为可以将单条配置内容直接存储在 ZooKeeper 的一个 ZNode 上，并利用 ZooKeeper 的 Watch 监听功能实现配置变化时对客户端的及时通知。按照 ZooKeeper 的设计目标，其只提供最基础的功能，包括顺序一致，原子性，单一系统镜像，可靠性和及时性。另外 Zookeeper 还有如下特点：

类文件系统的节点组织
稳定，无单点问题
订阅通知机制

关于 Zookeeper，更多见 https://zookeeper.apache.org/

QConf客户端

但在接口方面，ZooKeeper 本身只提供了非常基本的操作，并且其客户端接口原始，所以我们需要在 QConf 的客户端部分 解决如下问题：

降低与 ZooKeeper 的链接数原生的 ZooKeeper 客户端中，所有需要获取配置的进程都需要与 ZooKeeper 保持长连接，在生产环境中每个客户端机器可能都会有上百个进程需要访问数据，这对 ZooKeeper 的压力非常大而且也是不必要的。
本地缓存当然我们不希望客户端进程每次需要数据都走网络获取，所以需要维护一份客户端缓存，仅在配置变化时更新。
容错当进程退出、网络中断、机器重启等异常情况发生时，我们希望能尽可能的提供可靠的配置获取服务
多语言版本接口目前提供的语言版本包括：c，php，java，python，go，lua，shell
配置更新及时，可以秒级同步到所有客户端机器
高效的配置读取，内存级的访问速度

下面来看下 QConf 客户端的架构：

可以看到 QConf 客户端主要有：agent、各种语言接口、连接他们的消息队列和共享内存。在 QConf 中，配置以 key-value 的形式存在，业务进程给出 key 获得对应 value，这与传统的配置文件方式是一致的。

下面通过两个主要场景的数据流动来说明他们各自的功能和角色：

业务进程请求数据

业务进程调用某一种语言的 QConf 接口，从 共享内存 中查找需要的配置信息；
如果存在，直接获取，否则会向 消息队列 中加入该配置 key；
agent 从 消息队列 中感知需要获取的配置 key；
agent 向 ZooKeeper 查询数据并注册监听；
agent 将获得的配置 value 序列化后放入 共享内存；
业务进程从 共享内存 中获得最新值。

配置信息更新

ZooKeeper **通知 **agent 某配置项发生变化；
**agent **从 **ZooKeeper **查询新值并更新 watcher；
**agent **用新值更新 **共享内存 **中的该配置项。

通过上面的说明，可以看出 QConf 的整体结构和流程非常简单。QConf 中各个组件或线程之间仅通过有限的中间数据结构通信，耦合性非常小，各自只负责自己的本职工作和一亩三分地，而不感知整体结构。下面通过几个点来详细介绍：

无锁根据上文提到的配置信息的特征，我们认为在 QConf 客户端进行的是多进程并行读取的过程，对配置数据来说读操作远多于写操作。为了尽可能的提高读效率，整个 QConf 客户端在操作共享内存时采用的是无锁的操作，同时为了保证数据的正确，采取了如下两个措施：
单点写，将写操作集中到单一线程，其他线程通过中间数据结构与之通信，写操作排队，用这种方法牺牲掉一些写效率。在 QConf 客户端，需要对共享内存进行写操作的场景有：

用户进程通过消息队列发送的需获取 key；
ZooKeeper 配置修改删除等触发 Watcher 通知，需更新；
为了消除 watcher 丢失造成的不一致，需要定时对共享内存中的所有配置重新注册 watcher，此时可能会需要更新；
发生 agent 重启、网络中断、ZooKeeper 会话过期等异常情况之后，需重新拉数据，此时可能需要更新。

读验证，无锁的读写方式，会存在读到未写入完全数据的危险，但考虑到在绝对的读多写少环境中这种情况发生的概率较低，所以我们允许其发生，通过读操作时的验证来发现。共享内存数据在序列化时会带其 md5 值，业务进程从共享内存中读取时，利用预存的 md5 值验证是否正确读取。
异常处理 QConf 中采取了一些处理来应对不可避免的异常情况
采用父子进程 keepalive 的方式，应对 agent 进程异常退出的情况；
维护一份落盘数据，应对断网情况下共享内存又被清空的状况；
网络中断恢复后，对共享内存中所有数据进行检查，并重新注册 watcher；
定时扫描共享内存；
数据序列化 QConf 客户端中有多处需要将数据序列化通信或存储，包括共享内存，消息队列，落盘数据中的内容。采取如下协议：

agent 任务通过上面的描述，大家应该大概了解了 agent 所做的一些事情，下面从 agent 的内部的线程分工的角度整理一下，如下图：

Send 线程：ZooKeeper 线程，处理网络数据包，进行协议包的解析与封装，并将 Zookeeper 的事件加入 WaitingEvent 队列等待处理；
Event 线程：ZooKeeper 线程，依次获取 WaitingEvent 队列中的事件，并进行相应处理，这里我们关注节点删除、节点值修改、子节点变化、会话过期等事件。对特定的事件会进行相应的操作，以节点值修改为例，agent 会按上边提到的方式序列化该节点 key，并将其加入到 WaitingWriting 队列，等待 Main 线程处理；
Msq 线程：之前讲数据流动场景的时候有提到，用户进程从共享内存中找不到对应配置后，会向消息队列中加入该配置，Msq 线程便是负责从消息队列中获取业务进程的取配置需求，并同样通过 WaitingWriting 队列发送给 Main 进程；
Scan 线程：扫描共享内存中的所有配置，发现与 Zookeeper 不一致的情况时，将key值加入 WaitingWriting 队列。Scan 线程会在 ZooKeeper 重连或轮询期到达时进行上述操作；
Main 线程：共享内存的唯一写入线程，从 Zookeeper 获得数据写入共享内存，维护共享内存中的内容；
Trigger 线程：该线程负责一些周边逻辑的调用，包括：

dump 操作：将共享内存的内容同步一份到本地，QConf 采用的 gdbm；
feedback 操作：QConf 支持更新反馈的功能，可向用户指定 web 服务以一定的格式发送反馈；
script 操作：在某些情况下，业务希望当配置变化时，做一些自定义的操作，QConf 支持配置变化时调用用户脚本，agent 按一种固定的约定在配置发生变化时调用对应的脚本。

QConf管理端

管理端是业务修改配置的页面入口，利用数据库提供一些如批量导入，权限管理，版本控制等上层功能。由于公司内的一些业务耦合和需求定制，当前开源的 QConf 管理端这边提供了一个简易的页面，和一套下层的 c++ 接口，如下图：

之后计划进一步完善以及跟社区合作提供更友好的界面。

QConf 的结构及实现大概就介绍到这，接下来…

One More Thing

QConf 除了存储配置的基本功能外，还在公司内提供了一套简单的服务发现功能，该功能允许业务在 QConf 上配置一组服务，QConf 会监控其服务的存活。当业务进程调用获取服务的接口时，会根据用户需求，返回全部可用服务，或某一可用服务。不同于普通配置：

结构上多一个 Monitor 的角色，来监控所有服务的存活, 如下图：

提供对应的客户端接口，get_host 获取某一可用服务，get_allhost 获取所有可用服务
管理端页面对应的展示方式及操作，尤其是对指定服务的添加删除，上线下线

需要明确的是，目前 Monitor 事实上仅仅是通过查看服务端口的存活来判断的，在实际生产环境中，该功能多与实际服务提供者的监控结合，由服务提供者的监控调用 QConf 的相应接口实现服务的上下线。

使用方式及使用场景

目前 360 内部已经广泛的使用 QConf。覆盖云盘、大流程、系统部、dba、图搜、影视、地图、硬件、手机卫士、广告、好搜等大部分业务。部署国内外共 51 几个机房，客户端机器超两万台，稳定运行两年。

使用的方式主要包括：

简单配置公司内使用最广泛的用法，QConf 非常适合经常需要变动的配置使用，如开关信息、版本信息、推荐信息、超时时间等。
服务方式这种方式多被服务提供者采用，如 dba，系统部等，采用上述的服务配置的方式，通过 QConf 向公司的所有业务提供存储，计算及 web 服务。

QConf 因为其对配置信息的定位，使得整个结构非常简单，容易部署和使用。在 Github 可以找到完整代码，QConf Source Code 欢迎关注。

相关文章 »

配置管理服务横向对比

使用Supervisor管理进程

2017-09-23T09:56:57.000Z

Supervisor 是一款使用 Python 开发的非常优秀的进程管理工具。它可以在类 UNIX 系统上让用户精确地监视与控制多组指定数量的服务进程。当监控的服务进程意外退出时，会尝试自动重启这些服务，以保持服务可用状态。

安装

Supervisor 官方提供的安装方式较多，这里采用 pip 方式安装。

安装pip

$ yum install python-pip
# 升级pip
$ pip install --upgrade pip
$ pip -V
pip 9.0.1

安装Supervisor

通过 pip 安装 Supervisor：

$ pip install supervisor
Successfully installed supervisor-3.3.3

安装 Supervisor 后，会出现 supervisorctl 和 supervisord 两个程序，其中 supervisorctl 为服务监控终端，而 supervisord 才是所有监控服务的大脑。查看 supervisord 是否安装成功：

$ supervisord -v
3.3.3

开机启动

将 supervisord 配置成开机启动服务，下载官方 init 脚本。

修改关键路径配置：

PIDFILE=/var/run/supervisord.pid
LOCKFILE=/var/lock/subsys/supervisord
OPTIONS="-c /etc/supervisord.conf"

移到该文件到/etc/init.d目录下，并重命名为 supervisor，添加可执行权限：

$ chmod 777 /etc/init.d/supervisor

配置成开机启动服务：

$ chkconfig --add supervisor
$ chkconfig supervisor on
$ chkconfig --list | grep "supervisor"
supervisor  0:off 1:off 2:on 3:on 4:on 5:on 6:off

配置

生成配置文件

Supervisord 安装后，需要使用如下命令生成配置文件。

$ mkdir /etc/supervisor
$ echo_supervisord_conf > /etc/supervisor/supervisord.conf

主配置部分

supervisord.conf的主配置部分说明：

[unix_http_server]
file=/tmp/supervisor.sock   ; socket文件的路径
;chmod=0700                 ; socket文件权限
;chown=nobody:nogroup       ; socket文件用户和用户组
;username=user              ; 连接时认证的用户名
;password=123               ; 连接时认证的密码

[inet_http_server]          ; 监听TCP
port=127.0.0.1:9001         ; 监听ip和端口
username=user               ; 连接时认证的用户名
password=123                ; 连接时认证的密码

[supervisord]
logfile=/var/log/supervisord.log ; log目录
logfile_maxbytes=50MB        ; log文件最大空间
logfile_backups=10           ; log文件保持的数量
loglevel=info                ; log级别
pidfile=/var/run/supervisord.pid
nodaemon=false               ; 是否非守护进程态运行
minfds=1024                  ; 系统空闲的最少文件描述符
minprocs=200                 ; 可用的最小进程描述符
;umask=022                   ; 进程创建文件的掩码
;identifier=supervisor       ; supervisord标识符
;directory=/tmp              ; 启动前切换到的目录
;nocleanup=true              ; 启动前是否清除子进程的日志文件
;childlogdir=/tmp            ; AUTO模式，子进程日志路径
;environment=KEY="value"     ; 设置环境变量

[rpcinterface:supervisor]    ; XML_RPC配置
supervisor.rpcinterface_factory = supervisor.rpcinterface:make_main_rpcinterface

[supervisorctl]
serverurl=unix:///tmp/supervisor.sock ; 连接的socket路径
;username=chris               ; 用户名
;password=123                 ; 密码
prompt=mysupervisor           ; 输入用户名和密码时的提示符
;history_file=~/.sc_history   ; 历史操作记录存储路径

[include]                     ; 包含文件，将每个进程配置为一个文件并包含
files = /etc/supervisor/*.ini ; 多个进程的配置文件

这部分我们不需要做太多的配置修改，如果需要开启 WEB 终端监控，则需要配置并开启 inet_http_server 项。

进程配置部分

Supervisor 需管理的进程服务配置，示例如下：

[program:work]                      ; 服务名，例如work
command=php -r "sleep(10);exit(1);" ; 带有参数的可执行命令
process_name=%(process_num)s        ; 进程名，当numprocs>1时，需包含%(process_num)s
numprocs=2                          ; 启动进程的数目数
;directory=/tmp                     ; 运行前切换到该目录
;umask=022                          ; 进程掩码
;priority=999                       ; 子进程启动关闭优先级
autostart=true                      ; 子进程是否被自动启动
startsecs=1                         ; 成功启动几秒后则认为成功启动
;startretries=3                     ; 子进程启动失败后，最大尝试启动的次数
autorestart=unexpected            ; 子进程意外退出后自动重启的选项，false, unexpected, true。unexpected表示不在exitcodes列表时重启
exitcodes=0,2                     ; 期待的子程序退出码
;stopsignal=QUIT                  ; 进程停止信号，可以为TERM,HUP,INT,QUIT,KILL,USR1,or USR2等信号，默认为TERM
;stopwaitsecs=10                  ; 发送停止信号后等待的最大时间
;stopasgroup=false                ; 是否向子进程组发送停止信号
;killasgroup=false                ; 是否向子进程组发送kill信号
;redirect_stderr=true             ; 是否重定向日志到标准输出
stdout_logfile=/data/logs/work.log ; 进程的stdout的日志路径
;stdout_logfile_maxbytes=1MB      ; 日志文件最大大小
;stdout_logfile_backups=10
;stdout_capture_maxbytes=1MB
;stderr_logfile=/a/path           ; stderr的日志路径
;stderr_logfile_maxbytes=1MB
;stderr_logfile_backups=10
;stderr_capture_maxbytes=1MB
;environment=A="1",B="2"          ; 子进程的环境变量
;serverurl=AUTO                   ; 子进程的环境变量SUPERVISOR_SERVER_URL

通常将每个进程的配置信息配置成独立文件，并通过 include 模块包含，这样方便修改和管理配置文件。

启动

配置完成后，启动 supervisord 守护服务：

$ supervisord -c /etc/supervisor/supervisord.conf

常用的命令参数说明：

-c：指定配置文件路径
-n：是否非守护态运行
-l：日志文件目录
-i：唯一标识

查看 supervisord 启动情况：

$ ps -ef | grep "supervisor"
root  24901  1  0 Sep23 ? 00:00:30 /usr/bin/python /usr/bin/supervisord -c /etc/supervisor/supervisord.conf
$ netstat -tunpl
tcp 0 0 127.0.0.1:9001  0.0.0.0:*  LISTEN  24901/python

监控进程

Supervisor 提供了多种监控服务的方式，包括 supervisorctl 命令行终端、Web 端、XML_RPC 接口多种方式。

命令终端

直接使用 supervisorctl 即可在命令行终端查看所有服务的情况，如下：

$ supervisorctl 
work:0      RUNNING   pid 31313, uptime 0:00:07
work:1      RUNNING   pid 31318, uptime 0:00:06
# -u 用户名 -p 密码

supervisorctl 常用命令列表如下；

status：查看服务状态
update：重新加载配置文件
restart：重新启动服务
stop：停止服务
pid：查看某服务的 pid
tail：输出最新的 log 信息
shutdown：关闭 supervisord 服务

Web

在配置中开启 inet_http_server 后，即可通过 Web 界面便捷地监控进程服务了。

Lua在Nginx的应用

2017-09-09T13:25:59.000Z

当 Nginx 标准模块和配置不能灵活地适应系统要求时，就可以考虑使用 Lua 扩展和定制 Nginx 服务。OpenResty 集成了大量精良的 Lua 库、第三方模块，可以方便地搭建能够处理超高并发、扩展性极高的 Web 服务，所以这里选择 OpenResty 提供的 lua-nginx-module 方案。

安装Lua环境

lua-nginx-module 依赖于 LuaJIT 和 ngx_devel_kit。LuaJIT 需要安装，ngx_devel_kit 只需下载源码包，在 Nginx 编译时指定 ngx_devel_kit 目录。

系统依赖库

首先确保系统已安装如下依赖库。

$ yum install readline-devel pcre-devel openssl-devel gcc

安装LuaJIT

首先，安装 LuaJIT 环境，如下所示：

$ wget http://luajit.org/download/LuaJIT-2.0.5.tar.gz
$ tar zxvf LuaJIT-2.0.5.tar.gz
$ cd LuaJIT-2.0.5
$ make install
# 安装成功
==== Successfully installed LuaJIT 2.0.5 to /usr/local ====

设置 LuaJIT 有关的环境变量。

$ export LUAJIT_LIB=/usr/local/lib
$ export LUAJIT_INC=/usr/local/include/luajit-2.0
$ echo "/usr/local/lib" > /etc/ld.so.conf.d/usr_local_lib.conf
$ ldconfig

下载相关模块

下载 ngx_devel_kit 源码包，如下：

$ wget https://github.com/simpl/ngx_devel_kit/archive/v0.3.0.tar.gz
$ tar zxvf v0.3.0.tar.gz
# 解压缩后目录名
ngx_devel_kit-0.3.0

接下来，下载 Lua 模块 lua-nginx-module 源码包，为 Nginx 编译作准备。

$ wget https://github.com/openresty/lua-nginx-module/archive/v0.10.10.tar.gz
$ tar zxvf v0.10.10.tar.gz
# 解压缩后目录名
lua-nginx-module-0.10.10

加载Lua模块

Nginx 1.9 版本后可以动态加载模块，但这里由于版本太低只能重新编译安装 Nginx。下载 Nginx 源码包并解压：

$ wget http://nginx.org/download/nginx-1.13.5.tar.gz
$ tar zxvf nginx-1.13.5.tar.gz

编译并重新安装 Nginx：

$ cd nginx-1.13.5
# 增加--add-module=/usr/src/lua-nginx-module-0.10.10 --add-module=/usr/src/ngx_devel_kit-0.3.0
$ ./configure --prefix=/usr/local/nginx --with-http_ssl_module --with-http_v2_module --with-http_stub_status_module --with-pcre --add-module=/usr/src/lua-nginx-module-0.10.10 --add-module=/usr/src/ngx_devel_kit-0.3.0
$ make
$ make install
# 查看是否安装成功
$ nginx -v

配置Nginx环境

现在只需配置 Nginx，即可嵌入 Lua 脚本。首先，在 http 部分配置 Lua 模块和第三方库路径：

# 第三方库（cjson）地址luajit-2.0/lib
lua_package_path '/home/www/lua/?.lua;;';
lua_package_cpath '/usr/local/include/luajit-2.0/lib/?.so;;';

接着，配置一个 Lua 脚本服务：

# hello world测试
server {
    location /lua_content {
        # 定义MIME类型
        default_type 'text/plain';
        content_by_lua_block {
            ngx.say('Hello,world!')
        }
    }
}

测试安装和配置是否正常：

$ service nginx test
$ service nginx reload
# 访问地址/lua_content输出
Hello,world!

Lua调用Nginx

lua-nginx-module 模块中已经为 Lua 提供了丰富的 Nginx 调用 API，每个 API 都有各自的作用环境，详细描述见 Nginx API for Lua。这里只列举基本 API 的使用。

先配一个 Lua 脚本服务，配置文件如下：

location ~ /lua_api {  
    # 示例用的Nginx变量  
    set $name $host;
    default_type "text/html";  
    # 通过Lua文件进行内容处理
    content_by_lua_file /home/www/nginx-api.lua;  
}

请求部分

ngx.var

可以通过ngx.var.var_name形式获取或设置 Nginx 变量值，例如 request_uri、host、request 等。

-- ngx.say打印内容
ngx.say(ngx.var.request_uri)
ngx.var.name = 'www.fanhaobai.com'

ngx.req.get_headers()

该方法会以表的形式返回当前请求的头信息。查看请求的头信息：

ngx.say('Host : ', ngx.req.get_headers().host, '
')
for k,v in pairs(ngx.req.get_headers()) do
    if type(v) == "table" then
        ngx.say(k, " : ", table.concat(v, ","), '
')
    else
        ngx.say(k," : ", v, '
')
    end
end

当然，通过 ngx.req.set_header() 也可以设置头信息。

ngx.req.set_header("Content-Type", "text/html")

ngx.req.get_uri_args()

该方法以表形式返回当前请求的所有 GET 参数。查看请求 query 为?name=fhb的 GET 参数：

ngx.say('name : ', ngx.req.get_uri_args().name, '
')
for k,v in pairs(ngx.req.get_uri_args()) do
    if type(v) == "table" then
        ngx.say(k, " : ", table.concat(v, ","), '
')
    else
        ngx.say(k," : ", v, '
')
    end
end

同样，可以通过 ngx.req.set_uri_args() 设置请求的所有 GET 参数。

ngx.req.set_uri_args({name='fhb'}) --{name='fhb'}可以为query形式name=fhb

get_post_args()

该方法以表形式返回当前请求的所有 POST 参数，POST 数据必须是 application/x-www-form-urlencoded 类型。查看请求curl --data 'name=fhb' localhost/lua_api的 POST 参数：

--必须先读取body体
ngx.req.read_body()
ngx.say('name : ', ngx.req.get_post_args().name, '
')
for k,v in pairs(ngx.req.get_post_args()) do
    if type(v) == "table" then
        ngx.say(k, " : ", table.concat(v, ","), '
')
    else
        ngx.say(k," : ", v, '
')
    end
end

通过 ngx.req.get_body_data() 方法可以获取未解析的请求 body 体内容字符串。

ngx.req.get_method()

获取请求的大写字母形式的请求方式，通过 ngx.req.set_method() 可以设置请求方式。例如：

ngx.say(ngx.req.get_method())

响应部分

ngx.header

通过ngx.header.header_name的形式获取或设置响应头信息。如下：

ngx.say(ngx.header.content_type)
ngx.header.content_type = 'text/plain'

ngx.print()

ngx.print() 方法会填充指定内容到响应 body 中。如下所示：

ngx.print(ngx.header.content_type)

ngx.say()

如上述使用，ngx.say() 方法同 ngx.print() 方法，只是会在后追加一个换行符。

ngx.exit()

以某个状态码返回响应内容，状态码常量对应关系见 HTTP status constants 部分，也支持数字形式的状态码。

ngx.exit(403)

ngx.redirect()

重定向当前请求到新的 url，响应状态码可选列表为 301、302（默认）、303、307。

ngx.redirect('http://www.fanhaobai.com')

其他

ngx.re.match

该方法提供了正则表达式匹配方法。请求?name=fhb&age=24匹配 GET 参数中的数字：

local m, err = ngx.re.match(ngx.req.set_uri_args, "[0-9]+")
if m then
    ngx.say(m[0])
else
    ngx.say("match not found")
end

ngx.log()

通过该方法可以将内容写入 Nginx 日志文件，日志文件级别需同 log 级别一致。

ngx.md5() | ngx.encode_base64() | ngx.decode_base64()

它们都是字符串编码方式。ngx.md5() 可以对字符串进行 md5 加密处理，而 ngx.encode_base64() 是对字符串 base64 编码， ngx.decode_base64() 为 base64 解码。

Nginx中嵌入Lua

上面讲述了怎么在 Lua 中调用 Nginx 的 API 来扩展或定制 Nginx 的功能，那么编写好的 Lua 脚本怎么在 Nginx 中得到执行呢？其实，Nginx 是通过模块指令形式在其 11 个处理阶段做插入式处理，指令覆盖 http、server、server if、location、location if 这几个范围。

模块指令列表

这里只列举基本的 Lua 模块指令，更多信息参考 Directives 部分。

指令	所在阶段	使用范围	说明
init_by_lua init_by_lua_file	加载配置文件	http	可以用于初始化全局配置
set_by_lua set_by_lua_file	rewrite	server location location if	复杂逻辑的变量赋值，注意是阻塞的
rewrite_by_lua rewrite_by_lua_file	rewrite	http server location location if	实现复杂逻辑的转发或重定向
content_by_lua content_by_lua_file	content	location location if	处理请求并输出响应
header_filter_by_lua header_filter_by_lua_file	响应头信息过滤	http server location location if	设置响应头信息
body_filter_by_lua body_filter_by_lua_file	输出过滤	http server location location if	对输出进行过滤或修改

使用指令

注意到，每个指令都会有*_lua和*_lua_file两个指令，*_lua指令后为 Lua 代码块，而*_lua_file指令后为 Lua 脚本文件路径。下面将只对*_lua指令进行说明。

init_by_lua

该指令会在 Nginx 的 Master 进程加载配置时执行，所以可以完成 Lua 模块初始化工作，Worker 进程同样会继承这些。

nginx.conf配置文件中的 http 部分添加如下代码：

-- 所有worker共享的全局变量
lua_shared_dict shared_data 1m;  
init_by_lua_file /usr/example/lua/init.lua;

init.lua初始化脚本为：

local cjson = require 'cjson'
local redis = require 'resty.redis'
local shared_data = ngx.shared.shared_data

set_by_lua

我们直接使用 set 指令很难实现很复杂的变量赋值逻辑，而 set_by_lua 模块指令就可以解决这个问题。

nginx.conf配置文件 location 部分内容为：

location /lua {
    set_by_lua_file $num /home/www/set.lua;
    default_type 'text/html';
    echo $num;
}

set.lua脚本内容为：

local uri_args = ngx.req.get_uri_args()
local i = uri_args.a or 0
local j = uri_args.b or 0
return i + j

上述赋值逻辑，请求 query 为?a=10&b=2时响应内容为 12。

rewrite_by_lua

可以实现内部 URL 重写或者外部重定向。nginx.conf配置如下：

location /lua {
    default_type "text/html";
    rewrite_by_lua_file /home/www/rewrite.lua;
}

rewrite.lua脚本内容：

if ngx.req.get_uri_args()["type"] == "app" then
    ngx.req.set_uri("/m_h5", false);
end

access_by_lua

用于访问权限控制。例如，只允许带有身份标识用户访问，nginx.conf配置为：

location /lua {  
    default_type "text/html";
    access_by_lua_file /home/www/access.lua;
}

access.lua脚本内容为：

if ngx.req.get_uri_args()["token"] == "fanhb" then
    return ngx.exit(403)
end

content_by_lua

该指令在 Lua 调用 Nginx 部分已经使用过了，用于输出响应内容。

案例

访问权限控制

使用 Lua 模块对本站的 ES 服务做受信操作控制，即非受信 IP 只能查询操作。nginx.conf配置如下：

location / {
    set $allowed '115.171.226.212';
    access_by_lua_block {
        if ngx.re.match(ngx.req.get_method(), "PUT|POST|DELETE") and not ngx.re.match(ngx.var.request_uri, "_search") then
    start, _ = string.find(ngx.var.allowed, ngx.var.remote_addr)
    if not start then
ngx.exit(403)
    end
end
    }

    proxy_pass http://127.0.0.1:9200$request_uri;
}

访问频率控制

在 Nginx 配置文件的 location 部分配置 Lua 脚本基本参数，并配置 Lua 模块指令：

default_type "text/html";
set rate_per 300
access_by_lua_file /home/www/access.lua;

Lua 脚本实现频率控制逻辑，使用 Redis 对单位时间内的访问次数做缓存，key 为访问 uri 拼接 token 后的 md5 值。具体内容如下：

local redis = require "resty.redis"
local red = redis:new()

local limit = tonumber(ngx.var.rate_per) or 200
local expire_time = tonumber(ngx.var.rate_expire) or 1000
local key = "rate.limit:string:"

red:set_timeout(500)
local ok, err = red:connect("www.fanhaobai.com", 6379)
if not ok then
    ngx.log(ngx.ERR, "failed to connect redis: " .. err)
    return
end

key = key .. ngx.md5(ngx.var.request_uri .. (ngx.req.get_uri_args()['token'] or ngx.req.get_post_args()['token']))
local times, err = red:incr(key)
if not times then
    ngx.log(ngx.ERR, "failed to exec incr: " .. err)
    return
elseif times == 1 then
    ok, err = red:expire(key, expire_time)
    if not ok then
        ngx.log(ngx.ERR, "failed to exec expire: " .. err)
        return
    end
end

if times > limit then
    return ngx.exit(403)
end

return

相关文章 »

进入Lua的世界（2017-09-03）
Lua在Redis的应用（2017-09-04）

Lua在Redis的应用

2017-09-04T13:50:19.000Z

Redis 从 2.6 版本起，也已开始支持 Lua 脚本，我们可以更加得心应手地使用或扩展 Redis，特别是在高并发场景下 Lua 脚本提供了更高效、可靠的解决方案。

为什么要使用Lua

我们先看一个抢购场景下商品库存的问题，用 PHP 可简单实现为：

$key = 'number:string';
$redis = new Redis();
$number = $redis->get($key);
if ($number <= 0) {
    return 0;
}
$redis->decr($key);
return $number--;

这段代码其实存在问题，高并发时会出现库存超卖的情况，因为上述操作在 Redis 中不是原子操作，会导致库存逻辑的判断失效。尽管可以通过优化代码来解决问题，比如使用 Decr 原子操作命令、或者使用锁的方式，但这里使用 Lua 脚本来解决。

local key = 'number:string'
local number = tonumber(redis.call("GET", key))
if number <= 0 then
   return 0
end
redis.call("DECR", key)
return number--

这段脚本代码虽然是 Lua 语言编写（进入Lua的世界），但是其实就是 PHP 版本的翻译版。那为什么这样，Lua 脚本就能解决库存问题了呢？

Redis 中嵌入 Lua 脚本，所具有的几个特性为：

原子操作：Redis 将整个 Lua 脚本作为一个原子执行，无需考虑并发，无需使用事务来保证数据一致性；
高性能：嵌入 Lua 脚本后，可以减少多个命令执行的网络开销，进而间接提高 Redis 性能；
可复用：Lua 脚本会保存于 Redis 中，客户端都可以使用这些脚本；

在Redis中嵌入Lua

使用Lua解析器

Redis 提供了 EVAL（直接执行脚本）和 EVALSHA（执行 SHA1 值的脚本）这两个命令，可以使用内置的 Lua 解析器执行 Lua 脚本。语法格式为：

EVAL script numkeys key [key …] arg [arg …]
EVALSHA sha1 numkeys key [key …] arg [arg …]

参数说明：

script / sha1：EVAL 命令的第一个参数为需要执行的 Lua 脚本字符，EVALSHA 命令的一个参数为 Lua 脚本的 SHA1 值
numkeys：表示 key 的个数
key [key …]：从第三个参数开始算起，表示在脚本中所用到的那些 Redis 键（key），这些键名参数可以在 Lua 中通过全局数组 KYES[i] 访问
arg [arg …]：附加参数，在 Lua 中通过全局数组 ARGV[i] 访问

EVAL 命令的使用示例：

> EVAL "return {KEYS[1],KEYS[2],ARGV[1],ARGV[2]}" 2 key1 key2 first second
1) "key1"
2) "key2"
3) "first"
4) "second"

每次使用 EVAL 命令都会传递需执行的 Lua 脚本内容，这样增加了宽带的浪费。Redis 内部会永久保存被运行在脚本缓存中，所以使用 EVALSHA（建议使用）命令就可以根据脚本 SHA1 值执行对应的 Lua 脚本。

> SCRIPT LOAD "return 'hello'"
"1b936e3fe509bcbc9cd0664897bbe8fd0cac101b"
> EVALSHA 1b936e3fe509bcbc9cd0664897bbe8fd0cac101b 0
"hello"

Redis 中执行 Lua 脚本都是以原子方式执行，所以是原子操作。另外，redis-cli 命令行客户端支持直接使用--eval lua_file参数执行 Lua 脚本。

Redis 中有关脚本的命令除了 EVAL 和 EVALSHA 外，其他常用命令如下：

命令	描述
SCRIPT EXISTS script [script …]	查看脚本是是否保存在缓存中
SCRIPT FLUSH	从缓存中移除所有脚本
SCRIPT KILL	杀死当前运行的脚本
SCRIPT LOAD script	将脚本添加到缓存中,不立即执行返回脚本SHA1值

数据类型的转换

由于 Redis 和 Lua 都有各自定义的数据类型，所以在使用执行完 Lua 脚本后，会存在一个数据类型转换的过程。

Lua 到 Redis 类型转换与 Redis 到 Lua 类型转换相同部分关系：

Lua 类型	Redis 返回类型	说明
number	integer	浮点数会转换为整数 3.333–>3
string	bulk
table（array）	multi bulk
boolean false	nil

> EVAL "return 3.333" 0
(integer) 3
> EVAL "return 'fhb'" 0
"fhb"
> EVAL "return {'fhb', 'lw', 'lbf'}" 0
1) "fhb"
2) "lw"
3) "lbf"
> EVAL "return false" 0
(nil)

需要注意的是，从 Lua 转化为 Redis 类型比 Redis 转化为 Lua 类型多了一条额外规则：

Lua 类型	Redis 返回类型	说明
boolean true	integer	返回整型 1

> EVAL "return true" 0
(integer) 1

总而言之，类型转换的原则是将一个 Redis 值转换成 Lua 值，之后再将转换所得的 Lua 值转换回 Redis 值，那么这个转换所得的 Redis 值应该和最初时的 Redis 值一样。

全局变量保护

为了防止不必要的数据泄漏进 Lua 环境， Redis 脚本不允许创建全局变量。

-- 定义全局函数
function f(n)
    return n * 2
end
return f(4);

执行redis-cli --eval function.lua命令，会抛出尝试定义全局变量的错误：

(error) ERR Error running script (call to f_0a602c93c4a2064f8dc648c402aa27d68b69514f): @enable_strict_lua:8: user_script:1: Script attempted to create global variable 'f'

Lua脚本调用Redis命令

Redis 创建了用于与 Lua 环境协作的组件—— 伪客户端，它负责执行 Lua 脚本中的 Redis 命令。

调用Redis命令

在 Redis 内置的 Lua 解析器中，调用 redis.call() 和 redis.pcall() 函数执行 Redis 的命令。它们除了处理错误的行为不一样外，其他行为都保持一致。调用格式：

redis.call(command, [key …], arg [arg …] )
redis.pcall(command, [key …], arg [arg …] )

> EVAL "return redis.call('SET', 'name', 'fhb')" 0
> EVAL "return redis.pcall('GET', 'name')" 0
"fhb"

Redis日志

在 Lua 脚本中，可以通过调用 redis.log() 函数来写 Redis 日志。格式为：

redis.log(loglevel, message)

loglevel 参数可以是 redis.LOG_DEBUG、redis.LOG_VERBOSE、redis.LOG_NOTICE、redis.LOG_WARNING 的任意值。

查看redis.conf日志配置信息：

# logleval必须一致才会记录
loglevel notice
logfile "/home/logs/redis.log"

Lua 写 Redis 日志示例：

> EVAL "redis.log(redis.LOG_NOTICE, 'I am fhb')" 0
113:M 04 Sep 13:12:36.229 * I am fhb

案例

API 访问速率控制

通过 Lua 实现一个针对用户的 API 访问速率控制，Lua 代码如下：

local key = "rate.limit:string:" .. KEYS[1]
local limit = tonumber(ARGV[1])
local expire_time = tonumber(ARGV[2])
local times = redis.call("INCR", key)
if times == 1 then
    redis.call("EXPIRE", key, expire_time)
end
if times > limit then
    return 0
end
return 1

KEYS[1] 可以用 API 的 URI + 用户 uid 组成，ARGV[1] 为单位时间限制访问的次数，ARGV[2] 为限制的单位时间。

批量HGETTALL

这个例子演示通过 Lua 实现批量 HGETALL，当然也可以使用管道实现。

-- KEYS为uid数组
local users = {}
for i,uid in ipairs(KEYS) do
    local user = redis.call('hgetall', uid)
    if user ~= nil then
        table.insert(users, i, user)
    end
end
return users

注意事项

虽然使用 Lua 脚本给我们带来了许多便利，但是需要注意几个使用事项：

Lua 脚本在执行时是阻塞的，不应该在 Lua 脚本中有耗时的处理逻辑；
在集群模式时，Lua 脚本必须使用参数 key 传递需操作的 Redis 的 key，且要求所操作的 key 都在同一个 slot 节点上，可以使用以{}标记的 hash tag 方式解决。

相关文章 »

进入Lua的世界（2017-09-03）
Lua在Nginx的应用（2017-09-09）

进入Lua的世界

2017-09-03T14:49:22.000Z

Lua 是一个扩展式程序设计语言，作为一个强大、轻量的脚本语言，可以嵌入任何需要的程序中使用。Lua 被设计成一种动态类型语言，且它的语法相对较简单，这里只介绍其基本语法和使用方法，更多信息见 Lua 5.3 参考手册。

数据类型

Lua 作为通用型脚本语言，有 8 种基本数据类型：

类型	说明	示例
nil	只有一种值 nil 标识和别的任何值的差异	nil
boolean	两种值 false 和 true	false
number	实数（双精度浮点数）	520
string	字符串，不区分单双引号	“fhb” ‘fhb’
function	函数	function haha() return 1 end
userdata	将任意 C 数据保存在 Lua 变量
thread	区别独立的执行线程用来实现协程
table	表，实现了一个关联数组唯一一种数据结构	{1, 2, 3}

使用库函数 type() 可以返回一个变量或标量的类型。有关数据类型需要说明的是：

nil 和 false 都能导致条件为假，而另外所有的值都被当作真
在 number 和 string 类型参与比较或者运算时，会存在隐式类型转化，当然也可以显示转化（tonumber()）
由于 table、 function、thread、userdata 的值是所谓的对象，变量本身只是一个对对象的引用，所以赋值、参数传递、函数返回，都是对这些对象的引用传递

变量

Lua 中有三类变量：全局变量、局部变量、还有 table 的域。任何变量除非显式的以 local 修饰词定义为局部变量，否则都被定义为全局变量，局部变量作用范围为函数或者代码块内。说明，在变量的首次赋值之前，变量的值均为 nil。

-- 行注释
--[[
块注释
--]]
globalVar = 'is global'
-- if代码块
if 1 > 0 then
   local localVar = 'is local'
   print(localVar)    -- 可以访问局部变量
   print(globalVar)   -- 可以访问全局变量
end
print(localVar)       -- 不能访问局部变量
print(globalVar)      -- 可以访问全局变量

标识符约定

Lua 中用到的名字（标识符）可以是任何非数字开头的字母、数字、下划线组成的字符串，同大多数语言保持一致。

关键字

下面这些是保留的关键字，不能用作名字：

大部分的流程控制关键字将在流程控制部分说明。

操作符

大部分运算操作符将在表达式部分进行说明。

语句

Lua 的一个执行单元叫做 chunk（语句组），一个语句组就是一串语句段，而 block（语句块）是一列语句段。

do block end

下面将介绍 Lua 的主要流程控制语句。

条件语句

Lua 中同样是用 if 语句作为条件流程控制语句，else if 或者 else 子句可以省略。

-- exp为条件表达式，block为条件语句
if exp then
   block
elseif exp then
   block
else
   block
end

控制结构中的条件表达式可以返回任何值。 false 和 nil 都被认为是假，所有其它值都被认为是真。另外 Lua 中并没有提供 switch 子句，我们除了使用冗长的 if 子句外，怎么实现其他语言中的 switch 功能呢？

-- 利用表实现
local switch = {
   [1] = function()    -- 索引对应的域为匿名函数
      return "Case 1."
   end,
   [2] = function()
      return "Case 2."
   end,
   [3] = function()
      return "Case 3."
   end
}
local exp = 4         -- exp为条件表达式
local func = switch[exp]
-- 实现switch-default功能
if (func) then
   return func()
else
   return "Case default."
end

循环语句

Lua 支持 for、while、repeat 这三种循环子句。

while 子句结构定义为：

-- 结束条件为：循环条件==false
while 循环条件 do
    代码块
end

-- 1+...+10的和
local sum = 0
local i = 1
while i <= 10 do
   i = i + 1
   sum = sum + i
end
return sum

for 子句结构定义为：

 -- 结束条件为：变量<=循环结束值  
for 变量=初值, 循环结束值, 步长 do
   代码块
end

-- 1+...+10的和
local sum = 0
for i=1, 10, 1 do
   sum = sum + i
end
return sum

另外，for 结合 in 关键字可以遍历 table 类型的数据，如下：

local names = {'fhb', 'lw', 'lbf'}
local name;
for i,value in ipairs(names) do
   if i == 1 then
      name = value
   end
end
return name

repeat 子句只有循环条件为 true 时，才退出循环。跟通常使用习惯相反，因此使用较少。其结构定义为：

-- 结束条件为：循环条件==true
repeat
   代码块
until 循环条件
-- 1+...+10的和
local sum = 0
local i = 1
repeat
   i = i + 1
   sum = sum + i
until i > 10
return sum

语句的退出

return 和 break 关键字都可以用来退出语句组，但 return 关键字可以用来退出函数和代码块，包括循环语句，而 break 关键字只能退出循环语句。

表达式

在 Lua 中由多个操作符和操作数组成一个表达式。

赋值

Lua 允许多重赋值。因此，赋值的语法定义是等号左边是一系列变量，而等号右边是一系列的表达式。两边的元素都用逗号间。如果右值比需要的更多，多余的值就被忽略，如果右值的数量不够，将会被扩展若干个 nil。

-- 变量简单赋值
x = 10
y = 20
-- 交换x和y的值
x, y = y, x

数学运算

Lua 支持常见的数学运算操作符，见下表：

操作符	含义	示例
+ -	加减运算	10 - 5
* /	乘除运算	10 * 5
%	取模运算	10 % 5
^	求幂运算	4^(-0.5)
-	取负运算	-0.5

需要指出的是，string 类型进行数学运算操作时，会隐式转化为 number 类型。

return '12' / 6    -- 返回2

比较运算

Lua 中的比较操作符有见下表：

操作符	含义	示例
==	等于，为严格判断	“1” == 1 结果为 false
~=	不等于等价于==操作的反值	“1”~=1 结果为 true
< <=	小于或小于等于	1<=2
> >=	大于或大于等于	2>=1

比较运算的结果一定是 boolean 类型。如果操作数都是数字，那么就直接做数字比较，如果操作数都是字符串，就用字符串比较的方式进行，否则，无法进行比较运算。

逻辑运算

Lua 中的逻辑操作符有 and、or 以及 not，一样把 false 和 nil 都作为假，而其它值都当作真。

操作符	含义	示例
and	与	10 and 20
or	或	10 or 20
not	取非	not false

取反操作 not 总是返回 false 或 true 中的一个。 and 和 or 都遵循短路规则，也就是说 and 操作符在第一个操作数为 false 或 nil 时，返回这第一个操作数，否则，and 返回第二个参数； or 操作符在第一个操作数不为 nil 和 false 时，返回这第一个操作数，否则返回第二个操作数。

10 and 20           --> 20
nil and 10          --> nil
10 or 20            --> 10
nil or "a"          --> "a"
not false           --> true

其他运算

Lua 中还有两种特别的操作符，分别为字符串连接操作符（..）和取长度操作符（#）。

特别说明：

如果字符串连接操作符的操作数存在 number 类型，则会隐式转化为 string 类型
取长度操作符获取字符串的长度是它的字节数，table 的长度被定义成一个整数下标 n

'1' .. 2           --> '12'
#'123'             --> 3
#{1, 2}            --> 2

操作符优先级

Lua 中操作符的优先级见下表，从低到高优先级顺序：

运算符优先级通常是这样，但是可以用括号来改变运算次序。

函数

在 Lua 中，函数是和字符串、数值和表并列的基本数据结构，属于第一类对象( first-class-object)，可以和数值等其他类型一样赋给变量以及作为参数传递，同样可以作为返回值接收（闭包）。

定义函数

函数在 Lua 中定义也很简单，基本结构为：

-- arg为参数列表
function function_name(arg)
　　body
end

-- 阶乘函数
function fact(n)
    if n == 1 then
        return 1
    else
        return n * fact(n - 1)
    end
end
-- 调用函数
return fact(4)

可以用 local 关键字来修饰函数，表示局部函数。

local function foo(n)
    return n * 2
end

在 Lua 中有一个概念，函数与所有类型值一样都是匿名的，即它们都没有名称。当讨论一个函数名时，实际上是在讨论一个持有某函数的变量：

function f(x) return -x end
-- 上述写法只是一种语法糖，是下述代码的简写形式
f = function(x) return -x end

函数参数

Lua 中函数实参有两种传递方式，但大部分情况会进行值传递。

值传递

当实参值为非 table 类型时，会采用值传递。几个传参规则如下：

若实参个数大于形参个数，从左向右，多余的实参被忽略
若实参个数小于形参个数，从左向右，没有被初始化的形参被初始化为 nil
支持边长参数，用...表示

-- 定义两个函数
function f(a, b) end
function g(a, ...) end
-- 调用参数情况
f(3)             a=3, b=nil
f(3, 4, 5)       a=3, b=4
g(3, 4, 5)       a=3, ...  --> 4 5

当函数为变长参数时，函数内使用...来获取变长参数，Lua 5.0 后...替换为名 arg 的隐含局部变量。

function f(...)
   for k,v in ipairs({...}) do
      print(k, v)
   end
end

f(2,3,3)

引用传递

当实参为 table 类型时，传递的只是实参的引用而已。

local function f(arg)
   arg[3] = 'new'
end
local a = {1, 2}
f(a)
return a[3]        --> "new"

函数返回值

Lua 函数允许返回多个值，中间用逗号隔开。函数返回值接收规则：

若返回值个数大于接收变量的个数，多余的返回值会被忽略
若返回值个数小于参数个数，从左向右，没有被返回值初始化的变量会被初始化为 nil

function f1() return "a" end
function f2() return "a", "b" end

x, y = f1()         --> x="a", y=nil
x = f2()            --> x="a", "b"被丢弃
-- table构造式可以接受函数所有返回值
local tab = {f2()}  --> t={"a", "b"}
-- ()会迫使函数返回一个结果
printf((f2()))      --> "a"

Lua 中除了我们自定义函数外，已经实现了部分功能函数，见标准函数库。

表

定义和使用

Lua 中最特别的数据类型就是表（table），可以用来实现数组、Hash、对象，全局变量也使用表来管理。

-- array
local array = { 1, 2, 3 }
print(array[1], #array)          --> 1, 3
-- hash
local hash = { a=1, b=2, c=3 }
print(hash.a, hash['b'], #hash)  --> 1, 2, 0
-- array和hash
local tab = {1, 2, 3}
tab['x'] = function() return 'hash' end
return {tab.x, #tab}             --> 2, 3

说明：当表表示数组时，索引从 1 开始。

元表

元表（metatable）中的键名称为事件，值称为元方法，它用来定义原始值在特定操作下的行为。可通过 getmetatable() 来获取任一事件的元方法，同样可以通过 setmetatable() 覆盖任一事件的元方法。Lua 支持的表事件：

元方法	事件
__add(table, value) __sub(table, value)	+ 和 - 操作
__mul(table, value) __div(table, value)	* 和 / 操作
__mod(table, value) __pow(table, value)	% 和 ^ 操作
__concat(table, value)	.. 操作
__len(table)	# 操作
__eq(table, value) __lt(table, value) __le(table, value)	== 、<、<= 操作
__index(table, index) __newindex(table, index)	取和赋值下标操作
__call(table, …)	调用一个值
__tostring(table)	调用 tostring() 时

覆盖这些元方法，即可实现重载运算符操作。例如重载 tostring 事件：

local hash = { x = 2, y = 3 }
local operator = {
    __tostring = function(self)
        return "{ " .. self.x .. ", " .. self.y .. " }"
    end
}
setmetatable(hash, operator)
print(tostring(hash))             --> "{ 2, 3 }"

总结

Lua 是面向过程语言，使得可以简单易学。轻量级的特性，使得以脚本方式轻易地嵌入别的程序中，例如 PHP、JAVA、Redis、Nginx 等语言或应用。当然，Lua 也可以通过表实现面向对象编程。

相关文章 »

Lua在Redis的应用（2017-09-04）
Lua在Nginx的应用（2017-09-09）

使用Redis管道提升性能

2017-08-31T06:10:35.000Z

Redis 的管道（pipelining）是用来打包多条无关命令批量执行，以减少多个命令分别执行带来的网络交互时间。在一些批量操作数据的场景，使用管道可以显著提升 Redis 的读写性能。

原理演示

Redis 的管道实质就是命令打包批量执行，多次网络交互减少到单次。使用管道和不使用管道时的交互过程如下：

我们使用 nc 命令来直观感受下 Redis 管道的使用过程：

# 安装nc命令
$ yum install nc
# nc打包多个命令
$ (printf "PING\r\nPING\r\nPING\r\n") | nc localhost 6379
# 响应
+PONG
+PONG
+PONG

因此，只要通过管道进行命令打包后，Redis 就可以批量返回命令的执行结果了。

管道的应用

首先，构造示例需要的 Hash 用户数据：

$keyPrex = 'user:hash:u:';
for ($i=1; $i<=10000; $i++) {
    $redis->hMset($keyPrex.$i, [
        'name'   => name(),       //name()函数生成随机姓名
        'age'    => rand(21, 30),
        'sex'    => rand(0, 1),
        'is_new' => rand(0, 1)
    ]);
}

然后，查看导入 Redis 中的数据：

127.0.0.1:6379> keys user:hash:u:*
 9997) "user:hash:u:3013"
 9998) "user:hash:u:8971"
 9999) "user:hash:u:4761"
10000) "user:hash:u:1828"

127.0.0.1:6379> HGETALL user:hash:u:1828
1) "name"
2) "ggrg"
3) "age"
4) "23"
5) "sex"
6) "0"
7) "is_new"
8) "1"

需求

在某个社交活动中，通过一系列筛选逻辑后取得种子用户 uid，然后用这些 uid 去 Hash 获取用户的信息。这种情况下你会怎么来处理呢？

不使用管道

一般情况下，在数据量较小时，我们会直接使用 HGETALL 命令遍历地获取用户数据。

$start = nowTime();
foreach (range(1, 1000) as $id) {
    $user[] = $redis->hgetAll($keyPrex.$id);
}
echo '时间：', nowTime() - $start, 'ms', PHP_EOL;

时间：39ms

执行所用时间：39ms

使用管道

因为通过 uid 批量获取用户数据，各个命令并没有依赖关系，所以可以使用 Redis 的管道来优化查询。

$start = nowTime();
$redis->multi(Redis::PIPELINE);
foreach (range(1, 1000) as $id) {
    //返回资源id相同的socket资源，并未执行命令
    $redis->hgetAll($keyPrex.$id);  
}
$user = $redis->exec();
echo '时间：', nowTime() - $start, 'ms', PHP_EOL;

时间：6ms

使用管道后，执行时间显著地减少为：6ms。使用 tcpdump 抓取打包后的命令如下：

10:45:03.029049 IP localhost.58176 > localhost.6379: Flags [P.], seq 2255478840:2255479211, ack 3144685411, win 342, options [nop,nop,TS val 17640474 ecr 17640474], length 371
E..../@.@.o..........@...o.8.p.c...V.......
,.*2
$7
HGETALL
$13
user:hash:u:1
*2
$7
HGETALL
$13
user:hash:u:2
*2
$7
... ...

适用场景

在批量操作（查询和写入）数据时，我们应尽量避免多次跟 Redis 的网络交互。这时，可以使用管道实现，也可以 Redis 内嵌 Lua 脚本实现。需要注意的是：

管道只适用于无因果关联的多命令操作，否则就需要借助 Lua 脚本实现批量操作；
在实际应用中，Redis 往往不可能是单机部署，如果想要在集群中使用管道，可以部署为一主多从架构，此时所有节点的数据都一致，随机选取节点使用管道即可；

总结

在批量获取数据时，尽管使用 Redis 的管道性能会显著提升，但是使用管道时 Redis 会缓存之前命令的结果，最后一并输出给终端，因此所打包的命令不宜太多，否则内存使用会很严重。

Elasticsearch检索 — 聚合和LBS

2017-08-21T14:42:43.000Z

文章 Elasticsearch检索实战已经讲述了 Elasticsearch 基本检索使用，已满足大部分检索场景，但是某些特定项目中会使用到聚合和 LBS 这类高级检索，以满足检索需求。这里将讲述 Elasticsearch 的聚合和 LBS 检索使用方法。

本文示例的房源数据，见这里，检索同样使用 Elasticsearch 的 DSL 对比 SQL 来说明。

聚合

常规聚合

aggs 子句聚合是 Elasticsearch 常规的聚合实现方式。

桶和指标

先理解这两个基本概念：

名称	描述
桶（Buckets）	满足特定条件的文档的集合
指标（Metrics）	对桶内的文档进行统计计算

每个聚合都是一个或者多个桶和零个或者多个指标的组合，聚合可能只有一个桶，可能只有一个指标，或者可能两个都有。例如这个 SQL：

SELECT COUNT(field_name) FROM table GROUP BY field_name

其中COUNT(field_name)相当于指标，GROUP BY field_name相当于桶。桶在概念上类似于 SQL 的分组（GROUP BY），而指标则类似于 COUNT() 、 SUM() 、 MAX() 等统计方法。

桶和指标的可用取值列表：

分类	操作符	描述
桶	terms	按精确值划分桶
指标	sum	桶内对该字段值求总数
指标	min	桶内对该字段值求最小值
指标	max	桶内对该字段值求最大值
指标	avg	桶内对该字段值求平均数
指标	cardinality（基数）	桶内对该字段不同值的数量（distinct 值）

简单聚合

Elasticsearch 聚合 DSL 描述如下：

"aggs" : { 
    "aggs_name" : {
        "operate" : { "field" : "field_name" }
    }
}

其中，aggs_name 表示聚合结果返回的字段名，operate 表示桶或指标的操作符名，field_name 为需要进行聚合的字段。

例1，统计西二旗每个小区的房源数量：

-- SQL描述
SELECT resblockId, COUNT(resblockId) FROM rooms WHERE bizcircleCode = 611100314 GROUP BY resblockId

Elasticsearch 聚合为：

{
  "query": {
    "constant_score": {
      "filter": {
        "bool": {
          "must": [{ "term": { "bizcircleCode": 611100314 }}]
        }
      }
    }
  },
  "aggs": {
    "resblock_list": {
      "terms": { "field": "resblockId" }
    }
  }
}

聚合结果如下：

{
"hits": {
  "total": 6,
  "max_score": 1,
  "hits": [... ...]
},
"aggregations": {
  "resblock_list": {
     "doc_count_error_upper_bound": 0,
     "sum_other_doc_count": 0,
     "buckets": [
        {
          "key": 1321052240532, //小区id为1321052240532有4间房
          "doc_count": 4
        },
        {
          "key": 1111047349969,//小区id为1111047349969有1间房
          "doc_count": 1
        },
        {
          "key": 1111050770108,//小区id为1111050770108有1间房
          "doc_count": 1
        }
     ]
  }
}}

可见，此时聚合的结果有且只有分组后文档的数量，只适合做一些分组后文档数的统计。

例2，去重统计西二旗小区的数量：

-- SQL描述
SELECT COUNT(DISTINCT resblockId) FROM rooms WHERE bizcircleCode = 611100314

使用 cardinality 指标统计：

{
  "aggs": {
    "resblock_count": {
      "cardinality": {
        "field": "resblockId"
      }
    }
  }
}

添加度量指标

上述的简单聚合，虽然可以统计桶内的文档数量，但是没法实现组内的其他指标统计，比如小区内的最低房源价格，这时就可以给桶添加一个 min 指标。

-- SQL描述
SELECT resblockId, MIN(price) FROM rooms WHERE bizcircleCode = 611100314

添加 min 指标后为：

{
  "aggs": {
    "resblock_list": {
      "terms": { "field": "resblockId" },
      "aggs": {
        "min_price": {
          "min": { "field": "price" }
        }
      }
    }
  }
}

结果为：

"buckets": [
  {
    "key": 1321052240532,
    "doc_count": 4,
    "min_price": {
      "value": 3320
    }
  }
]

嵌套桶

当然桶与桶之间也可以进行嵌套，这样就能满足复杂的聚合场景了。

例如，统计每个商圈的房源价格分布情况：

-- SQL描述
SELECT bizcircleCode, GROUP_CONCAT(price) FROM rooms WHERE cityCode = 110000 GROUP BY bizcircleCode

桶聚合实现如下：

{
  "aggs": {
    "bizcircle_price": {
      "terms": { "field": "bizcircleCode" },
      "aggs": {
        "price_list": {
          "terms": { "field": "price" }
        }
      }
    }
  }
}

聚合结果如下：

{
  "bizcircle_price": {
  "doc_count_error_upper_bound": 0,
  "sum_other_doc_count": 0,
  "buckets": [
    {
      "key": 18335745,
      "doc_count": 1,
      "price_list": {
      "buckets": [
        {
          "key": 3500,
          "doc_count": 1
        }
      ]
    },
    ... ...
  ]
}

增加文档信息

通常情况下，聚合只返回了统计的一些指标，当需要获取聚合后每组的文档信息（小区的名字和坐标等）时，该怎么处理呢？这时，使用 top_hits 子句就可以实现。

例如，获取西二旗每个小区最便宜的房源信息：

{
  "aggs": {
    "rooms": {
      "top_hits": {
        "size": 1,
        "sort": { "price": "asc" },
        "_source": []
      }
    }
  }
}

其中，size 为组内返回的文档个数，sort 表示组内文档的排序规则，_source 指定组内文档返回的字段。

聚合后的房源信息：

{
  "bizcircle_price": {
    "buckets": [
    {
      "key": 1111050770108,
      "doc_count": 1,
      "rooms": {
        "hits": {
          "total": 1,
          "hits": [
            {
              "_index": "rooms",
              "_source": {
                "resblockId": 1111050770108,
                "resblockName": "领秀慧谷C区",
                "size": 15.3,
                "bizcircleName": [ "西二旗", "回龙观" ],
                "location": "40.106349,116.31051"
              },
              "sort": [ 3500 ]
           }
         ]
       }
     }
    }]
  }
}

字段折叠

从 Elasticsearch 5.0 之后，增加了一个新特性 field collapsing（字段折叠），字段折叠就是特定字段进行合并并去重，然后返回结果集，该功也能实现 agg top_hits 的聚合效果。

例如，增加文档信息部分的获取西二旗每个小区最便宜的房源信息，可以实现为：

{
  "collapse": {
    "field": "resblockId",  //按resblockId字段进行折叠
    "inner_hits": {
      "name": "top_price", //房源信息结果键名
      "size": 1,           //每个折合集文档数
      "sort": [            //每个折合集文档排序规则
        { "price": "desc" }
      ],
      "_source": []        //文档的字段
    }
  }
}

检索结果如下：

{
  "hits": {
    "total": 7,
    "hits": [
    {
      "_index": "rooms",
      "_score": 1,
      "_source": {
        "resblockId": 1111050770108,
        "resblockName": "领秀慧谷C区",
        ... ...
      },
      "fields": {
        "resblockId": [ 1111050770108 ]
      },
      "inner_hits": {
        "top_price": {
          "hits": {
            "total": 1,
            "hits": [ 
            { 
              "_index": "rooms",
              "_source": {
                "resblockId": 1111050770108,
                "resblockName": "领秀慧谷C区",
                "price": 3500,
                ... ...
                "location": "40.106349,116.31051"
              },
              "sort": [ 3500 ]
            }]
          }
        }
      }
    ]
  }
}

Field collapsing 和 agg top_hits 区别：field collapsing 的结果是够精确，同时速度较快，更支持分页功能。

LBS

Elasticsearch 同样也支持了空间位置检索，即可以通过地理坐标点进行过滤检索。

索引格式

由于地理坐标点不能被动态映射自动检测，需要显式声明对应字段类型为 geo-point，如下：

PUT /rooms   //索引名

{
  "mappings": {
    "room": {
      "properties": {
        ... ...
        "location": {          //空间位置检索字段
          "type": "geo_point"  //字段类型
        }
      }
    }
  }
}

数据格式

当需检索字段类型设置成 geo_point 后，推送的经纬度信息的形式可以是字符串、数组或者对象，如下：

形式	符号	示例
字符串	“lat,lon”	“40.060937,116.315943”
对象	lat 和 lon	{ “lat”:40.060937, “lon”:116.315943 }
数组	[lon, lat]	[116.315943, 40.060937]

特别需要注意数组形式时 lon 与 lat 的前后位置，不然就果断踩坑了。

然后，推送含有经纬度的数据：

POST /rooms/room/

{
  "resblockId": 1321052240532,
  "resblockName": "领秀新硅谷1号院",
  "houseId": 1112046338679,
  "cityCode": 110000,
  "size": 14,
  "bizcircleCode": [ 611100314 ],
  "bizcircleName": [ "西二旗" ],
  "price": 3330,
  "location": "40.060937,116.315943"
}

检索过滤方式

Elasticsearch 中支持 4 种地理坐标点过滤器，如下表：

名称	描述
geo_distance	找出与指定位置在给定距离内的点
geo_distance_range	找出与指定点距离在最小距离和最大距离之间的点
geo_bounding_box	找出落在指定矩形框中的点
geo_polygon	找出落在多边形中的点，将不说明

例如，查找西二旗地铁站 4km 的房源信息：

{
  "filter": {              //过滤搜索子句
    "geo_distance": {
      "distance": "4km",
      "location": {
        "lat": 40.106349,
        "lon": 116.31051
      }
    }
  }
}

LBS 检索的结果为：

{
  "hits": [
    {
      "_index": "rooms",
      "_source": {
        "resblockId": 1111050770108,
        "resblockName": "领秀慧谷C区",
        ... ...
        "location": "40.106349,116.31051"
      }
    },
    {
      "_index": "rooms",
      "_source": {
        "resblockId": 1111047349969,
        "resblockName": "融泽嘉园",
        ... ...
        "location": "40.074203,116.315445"
      }
    }
  ]
}

总结

本文讲述了使用 Elasticsearch 进行聚合和 LBS 检索，尽管文中只是以示例形式进行说明，会存在很多不全面的地方，还是希望对你我学习 Elasticsearch 能有所帮助。

相关文章 »

Elasticsearch检索实战（2017-08-09）

身份证的编码规则

2017-08-20T03:39:31.000Z

在我国现行的身份证系统中共有 15 位和 18 位两种身份证号码，第一代身份证大多为 15 位号码，由于 15 位身份证只能为 1900.01.01 到 1999.12.31 出生的人编码（千年虫问题），所以后来逐步替换为 18 位的身份证号码。

编码规则

15位

15 位身份证编码规则为：DDDDDD YYMMDD XXS

各组成部分说明：

部分名	描述
DDDDDD	6 位地区编码
YYMMDD	出生年月。年份用 2 位表示
XXS	顺序码。其中 S 为性别识别码，奇数为男，偶数为女

例如某个 15 位 ID 为：513701930509101。

18位

18 位身份证较 15 位身份证，出生年月改变为 8 位，并引入了校验位。编码规则为：DDDDDD YYYYMMDD XXX Y

各组成部分说明：

部分名	描述
DDDDDD	6 位地区编码
YYYYMMDD	出生年月。年份用 4 位表示
XXX	顺序码。奇数为男，偶数为女
Y	校验位。前 17 位值计算而得

校验位 Y 取值范围为 [1, 0, X, 9, 8, 7, 6, 5, 4, 3, 2]，其采用加权方式校验，校验规则为：p = mod(∑(Ai×Wi), 11)

参数说明：

i 为身份证数字所在的位数，1-17；
Ai 为身份证第 i 位对应的数字值；
Wi 为加权因子，值为 [7, 9, 10, 5, 8, 4, 2, 1, 6, 3, 7, 9, 10, 5, 8, 4, 2]；
p 表示获取 Y 范围值的第 p+1 个值作为校验值 Y；

例如某个 18 位 ID 位：513701199305091010，校验位后续计算得出。

格式校验

通过分析身份证的编码规则，我们就可以得出身份证的校验规则，这里使用正则表达式去进行匹配。

15位

15 位身份证DDDDDD YYMMDD XXS的每部分的正则匹配表达式为：

部分名	正则表达式
DDDDDD	[1-9]\d{5}
YYMMDD	(\d{2})(0[1-9]\|(1[0-2]))(([0-2][1-9])\|([1-2]0)\|31)
XXS	\d{3}

由此可得 15 位身份证证正则匹配表达式为：

'^[1-9]\d{5}\d{2}(0[1-9]|(1[0-2]))(([0-2][1-9])|([1-2]0)|31)\d{3}$'
//可简化为:
'^[1-9]\d{7}(0[1-9]|1[0-2])([0-2][1-9]|[1-2]0|31)\d{3}$'

PHP 中校验为：

const ID_15_PREG = '/^[1-9]\d{7}(0[1-9]|1[0-2])([0-2][1-9]|[1-2]0|31)\d{3}$/';

public static function validate($id)
{
    if (!is_string($id) || empty($id)) {
        return false;
    } else if (strlen($id) == 15 && preg_match(static::ID_15_PREG, $id)) {
        return true;
    }
    return false;
}

18位

同理，18 位身份证DDDDDD YYYYMMDD XXX Y的每部分的正则匹配表达式为：

部分名	正则表达式
DDDDDD	[1-9]\d{5}
YYYYMMDD	([1-9]\d{3})(0[1-9]\|(1[0-2]))(([0-2][1-9])\|([1-2]0)\|31)
XXX	\d{3}
Y	\d

由此可得 18 位身份证证正则匹配表达式为：

'^[1-9]\d{5}([1-9]\d{3})((0[1-9]|(1[0-2]))(([0-2][1-9])|([1-2]0)|31)\d{3}\d|[Xx]$'
//可简化为：
'^[1-9]\d{5}[1-9]\d{3}(0[1-9]|1[0-2])([0-2][1-9]|[1-2]0|31)(\d{4}|\d{3}[Xx])$'

根据校验位校验规则，实现 校验位 的编码：

public static function getCheckBit($id)
{
    if (18 !== strlen($id)) {
        return false;
    }
    $yArr = ['1', '0', 'X', '9', '8', '7', '6', '5', '4', '3', '2'];
    $wArr = [7, 9, 10, 5, 8, 4, 2, 1, 6, 3, 7, 9, 10, 5, 8, 4, 2];
    $sum = 0;
    for ($i = strlen($id)-2; $i>=0; $i--) {
        $sum += $id[$i] * $wArr[$i];
    }
    $key = $sum % 11;
    return $yArr[$key];
}

所以，PHP 中校验逻辑为:

const ID_18_PREG = '/^[1-9]\d{5}[1-9]\d{3}(0[1-9]|1[0-2])([0-2][1-9]|[1-2]0|31)(\d{4}|\d{3}[Xx])$/';

public static function validate($id)
{
    if (!is_string($id) || empty($id)) {
        return false;
    } else if (strlen($id) == 18 && preg_match(static::ID_18_PREG, $id) && strtoupper($id[17]) === self::getCheckBit($id)) {
       return true;
    } else if (strlen($id) == 15 && preg_match(static::ID_15_PREG, $id)) {
        return true;
    }
    return false;
}

15位转化为18位

在金融等某些特殊行业，需要将 15 位身份证号码格式化为 18 位。由于 15 位身份证颁发年份都是 19** 年，所以在转化为 18 位时补充出生年份时直接添加 19 即可。

转化步骤：

年份补全成 4 位，年份前直接添加 19；
补全上步的新号码为 18 位，可以在原号码末尾直接追加 X；
计算新号码的校验位并替换原校验位值；

15 位身份证转化为 18 位的代码如下：

public static function format18($id)
{
    if (!static::validate($id)) {
        return '';
    } else if (15 !== strlen($id)) {
        return $id;
    }
    $newId = substr($id, 0, 6) . '19' . substr($id, -9) . 'X';
    $newId[17] = static::getCheckBit($newId);
    return $newId;
}

转化示例结果：

//15位---------------------18位
'370725881105149' => '37072519881105149X'

APP接口多版本处理

2017-08-19T10:36:09.000Z

在开发 APP 端 API 接口时，随着 APP 的版本迭代，尽管通常 APP 只需要保持 4-5 个版本可用，过老版本会强制更新，但 API 接口避免不了出现多个版本的情况，那么 API 接口的多版本问题服务端怎么解决呢？

要实现 API 的版本控制，常见的方法就是引入版本号。本文结合 Yii 2 来进行演示。

版本号

传递 API 的版本号大致有两种方式：

版本号配置为子域名，但由于版本号变更频繁，该方式采用较少；
版本号嵌入 URL 中，如百度 API 的http://api.map.baidu.com/direction/v2/transit；
版本号放入 HTTP 请求头的 Accept 中，如Accept: application/json; version=1；

这两种方式都存在不足，第 1 种版本号跟资源不相关，所以违背 Restful 风格，第 2 种接口版本信息又不够直观。Yii 2 中混合了这两种方法实现了主版本号和小版本号，如下：

把每个主版本的 API 实现在一个单独的模块（例如 v1，v2），因此，API 的 URL 会包含主版本号；
在每一个主要版本（即相应的模块），使用 Accept 请求头确定小版本号实现具体业务逻辑；

之所以使用大小版本号是为了更好地分离代码。当小迭代或者 bug 修复时，更新小版本号，大的需求变更或者一次开发周期中迭代次数较多则更新大版本号。

版本兼容

每个版本代码放置于一个独立的目录下，由于项目中每个 API 同时存在多个版本，如果都是独立的多份代码，相邻版本之间逻辑大致相同，所以代码冗余较高，另外存在需要修改多份代码的情况，不易维护。

另一种方式是通过调整代码结构，新版本继承上一个版本，通过重写来更好地进行功能迭代和升级，同时也能版本兼容。

目录结构

根据大版本号分离成模块后，项目目录结构如下：

api/
    controllers/
        BaseAction.php  #版本控制
        BaseController.php  #基础控制器 
    models/
        logics/
            RoomLogic.php   #房源的相关公用检索逻辑
        SolrModel.php       #solr基础Model
        RoomModel.php       #房源数据源
    modules/
        v1/                     #v1
            controllers/
                room/
                    ListAction.php  #List方法所有版本
                RoomController.php  #v1版的房源控制器,继承自BaseController
            models/
                logics/
                    RoomLogic.php   #v1版的房源检索逻辑,继承自RoomLogic.php
            Module.php
        v2/                     #v2
            controllers/
                room/
                    ListAction.php  #List方法所有版本
                RoomController.php  #v2版的房源控制器,继承自BaseController
            models/
                logics/
                    RoomLogic.php   #v2版的房源检索逻辑,继承自v1/RoomLogic.php
            Module.php

代码示例

在编码时，尽量将每个版本公有逻辑提出到 common 下，只将版本特有逻辑放置于对应版本下。

common

公有部分，包括公有逻辑，数据源 model 等，放置于 controllers、models 部分。

BaseAction.php

BaseAction 用户处理小版本路由，后续的 Action 都继承自此。

namespace api\controllers;

use yii\base\InvalidCallException;
use yii\helpers\ArrayHelper;

class BaseAction extends \yii\base\Action
{
    /**
     * 版本逻辑
     */
    public function run()
    {
        $version = ArrayHelper::getValue(\Yii::$app->response->acceptParams, 'version', 1);
        if (method_exists($this, "version$version")) {
            call_user_func([$this, "version$version"]);
        } else {
            throw new InvalidCallException('invaild version.');
        }
    }
}

RoomModel.php

namespace api\models;

class RoomModel extends SolrModel
{
}

RoomLogic.php

namespace api\models\logics;

use api\models\RoomModel;

class RoomLogic
{
    /**
     * 统计房源数
     * @param array $params
     * @return array
     */
    public static function countRoomByResblock(array $params)
    {
        $model = new RoomModel();
        echo '从solr获取信息', PHP_EOL;
    }
}

v1

v1 版本为初始版本，大部分逻辑只需继承自公有逻辑common/RoomLogic.php。

v1/RoomController.php

namespace api\modules\v1\controllers;

use api\modules\v1\models\logics\RoomLogic;

class RoomController extends \api\controllers\BaseAction
{
    public function actions()
    {
        return [
            'list' => ['class' => 'api\modules\v1\controllers\room\ListAction']
        ];
    }
}

v1/ListAction.php

namespace api\modules\v1\controllers\room;

use api\modules\v1\models\logics\RoomLogic;
use yii\base\DynamicModel;

class ListAction extends \api\controllers\BaseAction
{
    //v1.1版本
    public function version1()
    {
        echo 'v1：', PHP_EOL;
        RoomLogic::countRoomByResblock($form->attributes);
    }
    
    //v1.2版本
    public function version2()
    {
        echo 'v1.2：', PHP_EOL;
        RoomLogic::countRoomByResblock($form->attributes);
    }
}

v1/RoomLogic.php

namespace api\modules\v1\models\logics;

class RoomLogic extends \api\models\logics\RoomLogic
{
    /**
     * v1版统计房源
     * @param array $params
     * @return array
     */
    public static function countRoomByResblock(array $params)
    {
        parent::countRoomByResblock($params);
    }
}

v1 版结果如下：

//请求信息
GET /v1/room/list.json
Accept: application/json; version=1
//响应
v1：
从solr获取信息

v2

v2 版逻辑对 v1 版进行了扩展，比如返回小区房源的最低价、小区房源总数等。

v2/RoomController.php

namespace api\modules\v2\controllers;

use api\controllers\BaseController;
use api\modules\v2\models\logics\RoomLogic;

class RoomController extends BaseController
{
    public function actions()
    {
        return [
            'list' => ['class' => 'api\modules\v2\controllers\room\ListAction']
        ];
    }
}

v2/ListAction.php

namespace api\modules\v2\controllers\room;

use api\modules\v2\models\logics\RoomLogic;
use yii\base\DynamicModel;

class ListAction extends \api\controllers\BaseAction
{
    //v2.1版本
    public function version1()
    {
        echo 'v2：', PHP_EOL;
        RoomLogic::countRoomByResblock($form->attributes);
    }
}

v2/RoomLogic.php

namespace api\modules\v2\models\logics;

class RoomLogic extends \api\modules\v1\models\logics\RoomLogic
{
    /**
     * v2版统计房源
     * @param array $params
     * @return array
     */
    public static function countRoomByResblock(array $params)
    {
        parent::countRoomByResblock($params);
        echo '我扩展了v1版逻辑', PHP_EOL;
    }
}

v2 版结果如下：

//请求信息
GET /v2/room/list.json
Accept: application/json; version=1
//响应
v2：
从solr获取信息
我扩展了v1版逻辑

v3

如果某一天，数据源需要从 solr 切换到 es，那么只需改写共有RoomLogic.php并保持数据结构不变，老版本数据也就切换为 es 了。

RoomModel 修改：

namespace api\models;

class RoomModel extends EsModel
{
}

RoomLogic 部分修改 countRoomByResblock 方法：

namespace api\models\logics;

use api\models\RoomModel;

class RoomLogic
{
    public static function countRoomByResblock(array $params)
    {
        $model = new RoomModel();
        echo '从es获取信息', PHP_EOL;
    }
}

v3 版结果如下：

v3：
从es获取信息
我扩展了v1版逻辑

老版本 v2 版结果如下；

v2：
从es获取信息
我扩展了v1版逻辑

总结

本文叙述的方式，虽然多个版本时代码不会冗余，但是每个版本之间会有较强的依赖关系，并没有做到应用解耦。实际中还需根据业务场景选择合适的版本处理方案，本文仅提供一种实现思路。

什么是Bitmap算法？

2017-08-16T15:10:42.000Z

转自伯乐专栏玻璃猫

本文的灵感来源于京东金融数据部张洪雨同学的项目经历，感谢这位大神的技术分享。

为满足用户标签的统计需求，小灰利用 MySQL 设计了如下的表结构，每一个维度的标签都对应着 MySQL 表的一列：

要想统计所有 90 后的程序员该怎么做呢？

用一条求交集的 SQL 语句即可：

SELECT COUNT(DISTINCT name) AS 用户数 FROM table WHERE age = '90后' AND occupation = '程序员'

要想统计所有使用苹果手机或者 00 后的用户总合该怎么做？用一条求并集的 SQL 语句即可：

SELECT COUNT(DISTINCT name) AS 用户数 FROM table WHERE phone = '苹果' OR age = '00后'

两个月之后——

———————————————

1.给定长度是 10 的 bitmap，每一个 bit 位分别对应着从 0 到 9 的 10 个整型数。此时 bitmap 的所有位都是 0。

2.把整型数 4 存入 bitmap，对应存储的位置就是下标为 4 的位置，将此 bit 置为 1。

3.把整型数 2 存入 bitmap，对应存储的位置就是下标为 2 的位置，将此 bit 置为 1。

4.把整型数 1 存入 bitmap，对应存储的位置就是下标为 1 的位置，将此 bit 置为 1。

5.把整型数 3 存入 bitmap，对应存储的位置就是下标为 3 的位置，将此 bit 置为 1。

要问此时 bitmap 里存储了哪些元素？显然是 4,3,2,1，一目了然。

bitmap 不仅方便查询，还可以去除掉重复的整型数。

1.建立用户名和用户 ID 的映射。

2.让每一个标签存储包含此标签的所有用户 ID，每一个标签都是一个独立的 bitmap。

3.这样，实现用户的去重和查询统计，就变得一目了然。

1.如何查找使用苹果手机的程序员用户？

2.如何查找所有男性或者00后的用户？

说明：该项目最初的技术选型并非 MySQL，而是内存数据库 hana。本文为了便于理解，把最初的存储方案写成了 MySQL 数据库。

漫画算法系列 »

Solr的使用 — 检索

2017-08-13T08:22:24.000Z

本文是延续 Solr的使用系列，前一篇文章已经讲了 Solr 的部署和数据推送，这里主要以示例方式讲述 Solr 的常见查询语法，同时介绍如何使用 PHP 语言的客户端 solarium 同 Solr 集群进行数据交互。

想要详细地了解 Solr 查询语法，可参考官方wiki。

数据格式

用于示例的数据，我已经推送到了 Solr ，见这里。数据 Core 为 rooms，数据格式形如：

[{
    "resblockId": 1111027377528,
    "resblockName": "金隅丽港城",
    "houseId": 1087599828743,
    "cityCode": 110000,
    "size": 10.5,
    "bizcircleCode": [ 18335711 ],
    "bizcircleName": [ "望京" ],
    "price": 2300,
    "location": "39.997106,116.469306",
    "id": "0119df79-68d9-4cd9-ba07-4d6395a4841c"
},
{
    "resblockId": 1111047349969,
    "resblockName": "融泽嘉园",
    ... ...
}]

查询语句的组成

通过向 Solr 集群 GET 请求/solr/core-name/select?query形式的查询 API 完成查询，其中 core-name 为查询的 Core 名称。查询语句 query 由以下基本元素项组成，按使用频率先后排序：

名称	描述	示例
wt	响应结果的格式	json
fl	指定结果集的字段	*（所有字段）
fq	过滤查询	id : 0119df79-68d9-4cd9-ba07
start	指定结果集起始返回的行数，默认 0	0
rows	指定结果集返回的行数，默认 10	15
sort	结果集的排序规则	price+asc
defType	设置查询解析器名称	dismax
timeAllowed	查询超时时间

wt

wt 设置结果集格式，支持 json、xml、csv、php、ruby、pthyon，序列化的结果集，常使用 json 格式。

fl

fl 指定返回的字段，多指使用“空格”和“,”号分割，但只支持设置了stored=true的字段。*表示返回全部字段，一般情况不需要返回文档的全部字段。

字段别名：使用displayName:fieldName形式指定字段的别名，例如：

fl=id,sales_price:price,name

函数：fl 还支持使用 Solr 内置函数，例如根据单价算总价：

fl=id,total:product(size,price)

fq

fq 过滤查询条件，可充分利用 cache，所以可以利用 fq 提高检索性能。

sort

sort 指定结果集的排序规则，格式为+，支持 asc 和 desc 两种排序规则。例如按照价格倒序排列：

sort=price+desc

也可以多字段排序，价格和面积排序：

sort=price+asc,size+desc

条件查询

查询字符串 q 由以下元素项组成，字段条件形如fieldName:value格式：

名称	描述	示例
q	查询字符串	:
q.op	表达式之间的关系操作符	AND/OR
df	查询被索引的字段	id:0119df79-68d9-4cd9-ba07

以上元素项的默认值由solrconfig.xml配置文件定义。通常查询时设置q=*:*，然后通过 fq 过滤条件来完成查询，通过缓存提高查询性能。

模糊查询

Solr 的模糊查询使用占位符来描述查询规则，如下：

符号	描述	示例
?	匹配单个字符	te?t 会检索到 test 和 text
*	匹配零个或多个字符	tes* 会检索到 tes、test 等

查询小区名称中包含“嘉”的房源信息：

-- SQL表述
SELECT * FROM rooms WHERE resblockName LIKE "%嘉%"

Solr 的模糊查询为：

fq=resblockName:*嘉*

单精确值查询

单精确值查询是最简单的查询，类似于 SQL 中 = 操作符。查询小区 id 为 1111027377528 的房源信息：

-- SQL表述
SELECT * FROM rooms WHERE resblockId = 1111027377528

Solr 中查询为：

fq=resblockId:1111027377528

多精确值查询

多精确值查询是单精确值查询的扩展，格式为(value1 value2 ...)，功能类似于 SQL 的 IN 操作符。查询小区 id 为 1111027377528 或者 1111047349969 的房源信息：

-- SQL表述
SELECT * FROM rooms WHERE resblockId IN (1111027377528, 1111047349969)

Solr 中查询为：

fq=resblockId:(1111027377528 1111047349969)

范围查询

范围查询是查询指定范围的值（数字和时间），格式为[value1 TO value2]，类似于 SQL 的 BETWEEN 操作符。查询价格在 [2000, 3000] 的房源信息：

-- SQL表述
SELECT * FROM rooms WHERE price BETWEEN 2000 AND 3000

Solr 中范围查询为：

fq=price:[2000 TO 3000]

几个特殊的范围查询：

条件	表达式	示例
>=	[value TO *]	price:[2000 TO *] 价格 >=2000
<=	[* TO value]	price:[* TO 2000] 价格 <=2000

布尔查询

将基本查询结合布尔查询，就可以实现大部分复杂的检索场景。布尔查询支持以下几种布尔操作：

操作逻辑	操作符	描述
AND	&& +	逻辑与关系
OR		逻辑或关系
NOT	！ -	逻辑取反关系

查询北京市价格区间在 [2000, 3000] 或者上海市价格区间在 [1500, 2000] 的房源信息：

-- SQL表述
SELECT * FROM rooms WHERE (cityCode=110000 AND price BETWEEN 2000 AND 3000) OR (cityCode=310000 AND price BETWEEN 1500 AND 2000)

转换为逻辑与布尔查询：

fq=(cityCode:110000 && price:[2000 TO 3000])||(cityCode:310000 && price:[1500 TO 2000])

Group查询

在实际中分组查询比较常见，当然 Solr 也支持分组查询。分组查询语句由以下基本元素项组成（常用部分）：

名称	类型	描述
group	boolean	是否进行分组查询
group.field	string	按该字段值进行分组
group.limit	integer	每组元素集大小，默认为 1
group.offset	integer	每组元素起始行数
group.sort	string	组内元素排序规则，asc 和 desc

查询西二旗内价格最便宜小区的房源信息：

-- SQL表述
SELECT * FROM rooms WHERE bizcircleCode=611100314 GROUP BY resblockId ORDER BY price ASC LIMIT 1

Group 分组查询为：

q=*:*&fq=bizcircleCode:611100314&group=true&group.field=resblockId&group.limit=1&group.sort=size+desc

结果为：

"groups": [
{
    "groupValue": 1111047349969,
    "doclist": {
    "numFound": 1,                 //每组房源数
    "start": 0,
    "docs": [
    {
        "resblockId": 1111047349969,
        "resblockName": "融泽嘉园",
        "bizcircleCode": [ 611100314 ],
        "price": 2500
        ... ...
    }]
    ... ...
}]

在大多数情况下，Group 分组已经能满足我们的需求，但是如果待分组字段为多值，Group 分组已经无能为力了，这时使用 Facet 就能轻松解决。

Solr 的 Facet 语句由以下基本元素构成（常用）：

名称	类型	描述
facet	boolean	是否进行 facet 查询
facet.field	string	按该字段值进行 facet
facet.limit	integer	每组元素集大小，默认为 1
facet.offset	integer	每组元素起始行数
facet.sort	string	结果集排序规则，asc 和 desc
facet.mincount	integer	每组元素最小数量

例如，统计每个商圈的房源分布情况并倒序排列，由于 bizcircleCode 字段为多值，Facet 查询为：

//此时不需要文档信息，故rows=0
q=*:*&fq=cityCode:110000&facet=true&facet.field=bizcircleCode&facet.sort=desc&rows=0

结果如下：

"facet_fields": {
    "bizcircleCode": [
        "18335711",
        1,
        "18335745",
        1,
        "611100314",
        3
    ]
}

空间检索

Solr 的 geofilt 过滤器可以实现 LBS 检索，但要在schema.xml配置中将需检索字段的字段类型设置为solr.LatLonType类型。geofilt 过滤器参数列表如下：

名称	描述	示例
d	检索距离，单位 km	2
pt	检索中心点坐标，格式：lat,lon	40.074203,116.315445
sfield	检索的索引字段	location

示例中的 location 字段，值为 “40.074203,116.315445”，类型配置为：

<fieldType name="location" class="solr.LatLonType" subFieldSuffix="_coordinate"/>
<field name="location" type="location"/>

则检索坐标点40.074203,116.315445附近 2 公里的房源信息：

q=*:*&fq={!geofilt}&spatial=true&pt=40.074203,116.315445&sfield=location&d=2

函数

Solr 提供一些函数以实现逻辑或数学运算。其中常用 数学运算 函数列表如下：

函数名	描述	示例
abs	求绝对值	abs(-5)
max	返回最大值	max(1, 2, 3)
min	返回最小值	min(1, 2, 3)
pow	返回指数运算的结果	pow(2, 2)
sqrt	开方运算的结果	sqrt(100)
product	乘积	product(1, 2, 3)
sub	差	sub(3, 2)
sum	和	sum(1, 2, 3)
div	商	div(4, 2)
log	10 的对数	log(10)

常用的 逻辑运算 函数：

函数名	描述	示例
def	定义字段默认值	def(price, 0)
if	if(test,value1,value2) test?value1:value2
exists	字段是否存在

这些函数可以使用在返回值或者查询条件上。例如返回每个房源的每平方米价格信息：

q=*:*&fl=*,avgPrice:div(price, size)

solarium客户端

PHP 可以使用 solarium 客户端，实现 Solr 数据源的检索，详细使用说明见这里。

配置基本

solarium 客户端需要配置 Solr 的基本信息。如下：

//config.php

$solr = [
    'endpoint' => [
        'localhost' => [
            'host' => 'solr.fanhaobai.com',
            'port' => 80,
            'path' => '/solr/rooms/',
        ]
    ]
];

基本查询

solarium 提供的查询方法较丰富，整理后如下表所示：

方法	所属对象	描述
createSelect	client	创建查询 query 对象
select	client	执行查询，返回 result 对象
setQuery	query	添加 query 条件
setStart	query	设置结果集起始行
setRows	query	设置结果集行数
setFields	query	设置返回的字段
addSort	query	结果集排序规则
createFilterQuery	query	创建 filter query 对象

查询北京市的所有房源信息，如下：

$client = new Solarium\Client($solr);
$query = $client->createSelect()->setStart(0)->setRows(20);
$query->createFilterQuery('rooms')->setQuery('cityCode:110000');
$result = $client->select($query);

Group查询

solarium 提供的分组查询方法如下表所示（常用）：

方法	所属对象	描述
getGrouping	query	创建分组 group 对象
addQuery	group	添加分组 query
setSort	group	设置分组排序规则
setLimit	group	设置分组数量
getGrouping	result	获取分组信息

获取西二旗每个小区的房源分布信息，如下：

$client = new Solarium\Client($solr);
$query = $client->createSelect()->setStart(0)->setRows(20)->setQuery('bizcircleCode:611100314');
$group = $query->getGrouping();
$group->addField('resblockId')->setLimit(10)->setSort('price desc')->setNumberOfGroups(true);
$result = $client->select($query);
$groups = $result->getGrouping();

solarium 提供的 Facet 查询方法，如下表（常用）：

方法	所属对象	描述
getFacetSet	query	创建分组 facet 对象
createFacetField	facet	创建 facet 字段
setField	facet	facet 分组字段
setLimit	facet	设置 facet 分组大小

获取北京市每个商圈的房源分布信息，如下：

$client = new Solarium\Client($solr);
$query = $client->createSelect()->setStart(0)->setRows(20)->setQuery('bizcircleCode:611100314');
$facet = $query->getFacetSet();
$facet->createFacetField('bizcircle')->setField('bizcircleCode')->setLimit(10);
$result = $client->select($query);

总结

到这里，Solr 系列就整理完毕了，未涉及的部分后续接触时再补充。这两天利用休息时间充电，自己在 Solr 方面的技能也算是上了一个台阶了。

相关文章 »

Solr的使用 — 部署和数据推送（2017-08-12）

Solr的使用 — 部署和数据推送

2017-08-12T09:19:01.000Z

来到 ziroom 后，我使用 Solr 支持业务也有段时间了，大多数情况下 Solr 满足业务需求，但由于 Solr 随着数据量急剧上升后检索性能和更新索引效率衰退较快，同时一些历史遗留原因导致字段较多不易维护，现架构上已将搜索引擎迁移到了 ES。在这里整理记录自己使用 Solr 的点滴，供后续学习和使用时参考。

Solr的使用系列的重点应是 Solr 的检索，如果需要可以直接传送到 Sorl检索部分。

部署

由于该 Solr 平台只供学习使用，所以直接采用 Docker 方式部署，这样能避免一些复杂的依赖环境导致的问题。

下载

从 Hub 拉取 Solr 官方镜像到本地，这里只选择 5.5 版本：

$ docker pull solr:5.5

安装

Docker 需要通过挂载宿主机目录的方式持久化数据，先创建供挂载目录（注意目录读写权限）：

$ mkdir -p /home/docker/solr

启动容器，挂载数据目录，隐射监听端口：

$ docker --name solr -p 127.0.0.1:8983:8983 -v /home/docker/solr:/opt/solr/server/solr -d solr:5.5

我们往往需要修改容器的一些默认参数（Solr 的配置），需要我们登入容器：

$ docker exec -it solr /bin/bash

注：由于容器中 /opt/solr/server/solr 会默认存在一些 Solr 启动的必须配置文件，直接将空目录挂载到该目录，会导致容器启动失败。可以先将目录挂载到 /opt/solr/mydata 目录，启动容器后cp /opt/solr/server/solr/* /opt/solr/mydata/，获得这些配置文件后，重新以上述地址挂载启动容器即可。

配置Web服务

Solr 容器启动成功后，配置 Web 服务器到 8983 端口，访问后看到 Solr Admin 页面，就表示安装成功了。

向 Solr 里推送数据，需要先建立 Core（核），然后在 Core 上创建或更新 Document（文档）。

新建Core

Core 默认路径为/opt/solr/server/solr。有两种方式新建 Core，方式一 是使用命令：

$ bin/solr create_core -c books
Creating new core 'books'
{
  "responseHeader":{
    "status":0,
    "QTime":1140
  },
  "core":"books"
}

#删除核使用delete

方式二：在 Admin 面板点击 “Core Admin >> Add Core”，填写 name、instanceDir、dataDir、config、schema（文档的字段类型描述）信息即可。由于 config 和 schema 配置可由模板生成，所以我偏向于使用命令方式创建。

注：方式一和方式二，其实都是通过/solr/admin/cores?action=CREATE这个 API 来完成创建任务。

新建 Core 后，可选中 books 核，点击 “Files”，这里列举出后面需要使用的 2 个配置文件：

$ pwd
/opt/solr/server/solr/bools/conf
#使用命令创建后自动生成，后续新建文档的字段类型描述需加入其中
managed-schema
solrconfig.xml

新建Document(s)

Document 存放着数据记录，新建 Document 后就可以使用 Solr 检索了。这里需存入 book 的数据格式（例如 json）如下：

{
    "id" : "978-0641723445",
    "cat" : ["book", "hardcover"],
    "name" : "The Lightning Thief",
    "author" : "Rick Riordan",
    "price" : 12.50
}

配置字段类型

如果没有配置字段映射类型推送数据时，Solr 会自动根据字段值设置字段的映射类型，并保存在core-name/conf/managed-schema文件，但是有时结果并不是我们想要的，所以配置文档的字段类型描述很有必要。

从上述 book 的数据可得，各个 Document 的字段类型关系：

字段名	类型	是否只被索引
id	string	√
cat	strings
name	string
author	strings
price	tdouble

字段类型通过文件schema.xml描述，需放置于 Core 的 conf 目录，文档格式可以参考managed-schema文件，基本要素大致为：

"1.0" encoding="UTF-8"?>

<schema name="books" version="1.6">
    
    <uniqueKey>iduniqueKey>
    
    <fieldType name="boolean" class="solr.BoolField" sortMissingLast="true"/>
    <fieldType name="booleans" class="solr.BoolField" sortMissingLast="true" multiValued="true"/>
    <fieldType name="int" class="solr.TrieIntField" positionIncrementGap="0" precisionStep="0"/>
    ... ...
    
    <field name="_version_" type="long" indexed="true" stored="true"/>
    <field name="author" type="strings"/>
    <field name="cat" type="strings"/>
    <field name="id" type="string" indexed="true" required="true" stored="true"/>
    <field name="name" type="string"/>
    <field name="price" type="tdouble"/>
    ... ...
    
    <dynamicField name="*_s" type="string" indexed="true" stored="true"/>
    ... ...
    <copyField source="*" dest="_text_"/>
schema>

注：如果后续更新 schema.xml 配置后，需要对 Core 进行 Reload 操作，否则检索时字段类型可能未变更。可以点击 “Core Admin >> Reload” 操作。

推送数据

Solr 支持的数据源类型较多，为 xml、json、csv 等格式。

方式一：使用 post 命令：

#post工具
$ bin/post -c books server/solr/data/books.json

books.json是以 json 格式描述的一些 book，可以批量推送数据。

方式二：在 Admin 面板点击 “books >> Documents”，在 Document(s) 一栏中输入一个 book 信息，并点击 “ Submit Document” 即可。成功右侧会返回：

Status: success
Response:
{
  "responseHeader": {
    "status": 0,
    "QTime": 12
  }
}

也可以通过检索，可以查看数据推送是否成功，检索结果为：

"docs": [
{
    "id": "978-0641723445",
    "cat": [
        "book",
        "hardcover"
    ],
    "name": "The Lightning Thief",
    "author": [
        "Rick Riordan"
    ],
    "price": 12.5,
    "_version_": 1575546976608452600
}]

注：方式一和二其实是殊途同归，都是 POST 请求solr/books/update?wt=json这个 API。

删除Document(s)

删除 Document 其实也是 update 操作，同样有两种方式。

先使用 xml 格式构建需要删除 Document 的条件描述del-book.xml，如删除 id 为 978-0641723445 的 book 信息：

<delete>
    
    <query>id:978-0641723445query>
delete>

<commit/>

方式一：同样使用 post 命令：

$ bin/post -c books server/solr/data/del-book.xml
#这里会自动提交commit,所以del-book.xml中无commit也可以
COMMITting Solr index changes to http://localhost:8983/solr/books/update..

方式二：在 Admin 面板点击 “books >> Documents”，Document Type 项选择 xml，然后在 Document(s) 一栏中输入需要删除 book 的条件描述（del-book.xml 内容），并点击 “ Submit Document” 即可。

重新检索，可以发现 id 为 978-0641723445 的 book 信息已经被成功删除。

注：方式一和二都是 POST 请求solr/books/update?wt=json这个 API。

总结

本文仅仅叙述了 Solr 的 Docker 单节点部署和简单的数据推送实现，由于个人能力和时间限制，并未涉及到其生成环境的应用环节。后续的一篇文章将会记录 Solr 的检索语法和 PHP 作为客户端调用 Solr 服务的一种方案。

相关文章 »

Solr的使用 — 检索（2017-08-13）

Elasticsearch检索实战

2017-08-09T15:38:30.000Z

随着公司房源数据的急剧增多，现搜索引擎 Solr 的搜索效率和建立索引效率显著降低，而 Elasticsearch 是一个实时的分布式搜索和分析引擎，它是基于全文搜索引擎 Apache Lucene 之上，接入 Elasticsearch 是必然之选。本文是我学习使用 Elasticsearch 检索的笔记。

Elasticsearch 支持 RESTful API 方式检索，查询结果以 JSON 格式响应，文中示例数据见这里。有关 Elasticsearch 详细使用说明，见官方文档。

Url

检索 url 中需包含 索引名，_search为查询关键字。例如 http://es.fanhaobai.com/rooms/_search 的 rooms 为索引名，此时表示无任何条件检索，检索结果为：

GET /rooms/_search

{
   "took": 6,
   "timed_out": false,
   "_shards": { ... },
   "hits": {
      "total": 3,
      "max_score": 1,
      "hits": [
         {
            "_index": "rooms",
            "_type": "room_info",
            "_id": "3",
            "_score": 1,
            "_source": {
               "resblockId": "1111027377528",
               "resblockName": "金隅丽港城",
               "houseId": 1087599828743,
               "cityCode": 110000,
               "size": 10.5,
               "bizcircleCode": [ "18335711" ],
               "bizcircleName": [ "望京" ],
       "price": 2300
            }
         },
         {
            ... ...
            "_source": {
               "resblockId": "1111047349969",
               "resblockName": "融泽嘉园",
               "houseId": 1087817932553,
               "cityCode": 110000,
               "size": 10.35,
               "bizcircleCode": [ "611100314" ],
               "bizcircleName": [ "西二旗" ],
               "price": 2500
            }
         },
 ... ...
      ]
   }
}

注：Elasticsearch 官方偏向于使用 GET 方式（能更好描述信息检索的行为），GET 方式可以携带请求体，但是由于不被广泛支持，所以 Elasticsearch 也支持 POST 请求。后续查询语言使用 POST 方式。

当我们确定了需要检索文档的 url 后，就可以使用查询语法进行检索，Elasticsearch 支持以下 Query string（查询字符串）和 DSL（结构化）2 种检索语句。

检索语句

Query string

我们可以直接在 get 请求时的 url 后追加q=查询参数，这种方法常被称作 query string 搜索，因为我们像传递 url 参数一样去传递查询语句。例如查询小区 id 为 1111027374551 的房源信息：

GET /rooms/_search?q=resblockId:1111027374551

//查询结果,无关信息已省略
{
   "hits": [
      {
         "_source": {
            "resblockId": "1111027374551",
            "resblockName": "国风北京二期",
            ... ...
         }
      }
   ]
}

虽然查询字符串便于查询特定的搜索，但是它也有局限性。

DSL

DSL 查询以 JSON 请求体的形式出现，它允许构建更加复杂、强大的查询。DSL 方式查询上述 query string 查询条件则为：

POST /rooms/_search

{
   "query": {
      "term": {
         "resblockId": "1111027374551"
      }
   }
}

term 语句为过滤类型之一，后面再进行说明。使用 DSL 语句查询支持 filter（过滤器）、match（全文检索）等复杂检索场景。

基本检索

Elasticsearch 支持为 2 种检索行为，它们都是使用 DSL 语句来表达检索条件，分别为 query （结构化查询）和 filter（结构化搜索）。

说明：后续将使用 SQL 对比 DSL 语法进行搜索条件示例。

结构化查询

结构化查询支持全文检索，会对检索结果进行相关性计算。使用结构化查询，需要传递 query 参数：

{ "query": your_query }
//your_query为{}表示空查询

注：后续查询中不再列出 query 参数，只列出 your_query（查询内容）。

match_all查询

match_all 查询简单的匹配所有文档。在没有指定查询方式时，它是默认的查询。查询所有房源信息：

-- SQL表述
SELECT * FROM rooms

match_all 查询为：

{ "match_all": {}}

match查询

match 查询为全文搜索，类似于 SQL 的 LIKE 查询。查询小区名中包含“嘉”的房源信息：

-- SQL表述
SELECT * FROM rooms WHERE resblockName LIKE '%嘉%'

match 查询为：

{ "match": { "resblockName": "嘉" }}
//结果
"hits": [
    {
        "_source": {
            "resblockId": "1111047349969",
            "resblockName": "融泽嘉园",
            ... ...
        }
    }
]

multi_match查询

multi_match 查询可以在多个字段上执行相同的 match 查询：

{
    "multi_match": {
        "query":  "京",
        "fields": [ "resblockName", "bizcircleName" ]
    }
}

range查询

range 查询能检索出那些落在指定区间内的文档，类似于 SQL 的 BETWEEN 操作。range 查询被允许的操作符有：

操作符	操作关系
gt	大于
gte	大于等于
lt	小于
lte	小于等于

查询价格在 (2000, 2500] 的房源信息：

-- SQL表述
SELECT * FROM rooms WHERE price BETWEEN 2000 AND 2500 AND price != 2000

range 查询为：

{
    "range": {
        "price": {
            "gt": 2000,
            "lte": 2500
        }
    }
}

term查询

term 查询用于精确值匹配，可能是数字、时间、布尔。例如查询房屋 id 为 1087599828743 的房源信息：

-- SQL表述
SELECT * FROM rooms WHERE houseId = 1087599828743

term 查询为：

{ "term": { "houseId": 1087599828743 }}

terms查询

terms 查询同 term 查询，但它允许指定多值进行匹配，类似于 SQL 的 IN 操作。例如查询房屋 id 为 1087599828743 或者 1087817932342 的房源信息：

-- SQL表述
SELECT * FROM rooms WHERE houseId IN (1087599828743, 1087817932342)

terms 查询为：

{ "terms": { "houseId": [ 1087599828743, 1087817932342 ] }}

term 查询和 terms 查询都不分析输入的文本，不会进行相关性计算。

exists查询和missing查询

exists 查询和 missing 查询被用于查找那些指定字段中有值和无值的文档，类似于 SQL 中的 IS NOT NULL 和 IS NULL 查询。查询价格有效的房源信息：

-- SQL表述
SELECT * FROM rooms WHERE price IS NOT NULL

exists 查询为：

{ "exists": { "field": "price" }}

bool查询

我们时常需要将多个条件的结构进行逻辑与和或操作，等同于 SQL 的 AND 和 OR，这时就应该使用 bool 子句合并多子句结果。共有 3 种 bool 查询，分别为 must（AND）、must_not（NOT）、should（OR）。

操作符	描述
must	AND 关系，必须匹配这些条件才能检索出来
must_not	NOT 关系，必须不匹配这些条件才能检索出来
should	OR 关系，至少匹配一条条件才能检索出来
filter	必须匹配，不参与评分

查询小区中包含“嘉”字或者房屋 id 为 1087599828743 的房源信息：

-- SQL表述
SELECT * FROM rooms WHERE (resblockName LIKE '%嘉%' OR houseId = 1087599828743) AND (cityCode = 110000)

bool 查询为：

{
  "bool": {
     "must": {
        "term": {"cityCode": 110000 }
     },
     "should": [
        { "term": { "houseId": 1087599828743 }},
        { "match": { "resblockName": "嘉" }}
     ]
  }
}

使用 filter 语句来使得其子句不参与评分过程，减少评分可以有效地优化性能。重写前面的例子：

{
  "bool": {
     "should": [
        { "match": { "resblockName": "嘉" }}
     ],
     "filter" : {
        "bool": {
           "must": { "term": { "cityCode": 110000 }},
           "should": [
              { "term": { "houseId": 1087599828743 }}
           ]
        }
     }
  }
}

bool 查询可以相互的进行嵌套，已完成非常复杂的查询条件。

constant_score查询

constant_score 查询将一个不变的常量评分应用于所有匹配的文档。它被经常用于你只需要执行一个 filter（过滤器）而没有其它查询（评分查询）的情况下。

{
    "constant_score": {
        "filter": {
            "term": { "houseId": 1087599828743 } 
        }
    }
}

结构化搜索

结构化搜索的查询适合确定值数据（数字、日期、时间），这些类型数据都有明确的格式。结构化搜索结果始终是是或非，结构化搜索不关心文档的相关性或分数，它只是简单的包含或排除文档，由于结构化搜索使用到过滤器，在查询时需要传递 filter 参数，由于 DSL 语法查询必须以 query 开始，所以 filter 需要放置在 query 里，因此结构化查询的结构为：

{
    "query": {
        "constant_score": { 
            "filter": {
                //your_filters
            }
        }
    }
}

注：后续搜索中不再列出 query 参数，只列出 your_filters（过滤内容）。

结构化搜索一样存在很多过滤器 term、terms、range、exists、missing、bool，我们在结构化查询中都已经接触过了。

term搜索

最为常用的 term 搜索用于查询精确值，可以用它处理数字（number）、布尔值（boolean）、日期（date）以及文本（text）。查询小区 id 为 1111027377528 的房源信息：

-- SQL表述
SELECT * FROM rooms WHERE resblockId = "1111027377528"

term 搜索为：

{ "term": { "resblockId": "1111027377528" }}

类似XHDK-A-1293-#fJ3这样的文本直接使用 term 查询时，可能无法获取到期望的结果。是因为 Elasticsearch 在建立索引时，会将该数据分析成 xhdk、a、1293、#fj3 字样，这并不是我们期望的，可以通过指定 not_analyzed 告诉 Elasticsearch 在建立索引时无需分析该字段值。

terms搜索

terms 搜索使用方式和 term 基本一致，而 terms 是搜索字段多值的情况。查询商圈 code 为 18335711 或者 611100314 的房源信息：

-- SQL表述
SELECT * FROM rooms WHERE bizcircleCode IN (18335711, 611100314)

terms搜索为：

{ "terms": { "bizcircleCode": [ "18335711", "611100314" ] }}

range搜索

在进行范围过滤查询时使用 range 搜索，支持数字、字母、日期的范围查询。查询面积在 [15, 25] 平米之间的房源信息：

-- SQL表述
SELECT * FROM rooms WHERE size BETWEEN 10 AND 25

range 搜索为：

{
    "range": {
        "size": {
            "gte": 10,
            "lte": 25
        }
    }
}

range 搜索使用在日期上：

{
    "range": {
        "date": {
            "gt": "2017-01-01 00:00:00",
            "lt": "2017-01-07 00:00:00"
        }
    }
}

exists和missing搜索

exists 和 missing 搜索是针对某些字段值存在和缺失的查询。查询房屋面积存在的房源列表：

-- SQL表述
SELECT * FROM rooms WHERE size IS NOT NULL

exists 搜索为：

{"exists": { "field": "size" }}

missing 搜索刚好和 exists 搜索相反，但语法一致。

bool组合搜索

bool 过滤器是为了解决过滤多个值或字段的问题，它可以接受多个其他过滤器作为子过滤器，并将这些过滤器结合成各式各样的逻辑组合。

bool 过滤器的组成部分，同 bool 查询一致：

{
   "bool": {
      "must":     [],
      "should":   [],
      "must_not": [],
   }
}

类似于如下 SQL 查询条件：

SELECT * FROM rooms WHERE (bizcircleCode = 18335711 AND price BETWEEN 2000 AND 2500) OR (bizcircleCode = 611100314 AND price >= 2500)

使用 bool 过滤器实现为：

{
   "bool": {
       "should": [
           { 
              "term": { "bizcircleCode": "18335711" },
              "range": { "price": { "gte": 2000, "lte": 25000 }}
           }, 
           { 
              "term": { "bizcircleCode": "611100314" },
              "range": { "price": { "gte": 2500 }}
           } 
       ]
   }
}

区别：结构化查询会进行相关性计算，因此不会缓存检索结果；而结构化搜索会缓存搜索结果，因此具有较高的检索效率，在不需要全文搜索或者其它任何需要影响相关性得分的查询中建议只使用结构化搜索。当然，结构化查询和结构化搜索可以配合使用。

聚合

该部分较复杂，已单独使用文章进行说明，见 Elasticsearch检索 — 聚合和LBS 部分。

_source子句

某些时候可能不需要返回文档的全部字段，这时就可以使用 _source 子句指定返回需要的字段。只返回需要的房源信息字段：

{
   "_source": [ "cityCode", "houseId", "price", "resblockName" ]
}

sort子句

简单排序

排序是使用比较多的推荐方式，在 Elasticsearch 中，默认会按照相关性进行排序，相关性得分由一个浮点数进行表示，并在搜索结果中通过_score参数返回（未参与相关性评分时分数为 1），默认是按_score降序排序。

sort 方式有 desc、asc 两种。将房源查询结果按照价格升序排列：

{
   "sort": {
      "price": { "order": "asc" }}
   }
}

多级排序

当存在多级排序的场景时，结果首先按第一个条件排序，仅当结果集的第一个 sort 值完全相同时才会按照第二个条件进行排序，以此类推。

{
   "sort": [
      { "price": { "order": "asc" }},
      { "_score": { "order": "desc" }}  //price一直时，按照相关性降序
   ]
}

字段多指排序

当字段值为多值及字段多指排序，Elasticsearch 会对于数字或日期类型将多值字段转为单值。转化有 min 、max 、avg、 sum 这 4 种模式。

例如，将房源查询结果按照商圈 code 升序排列：

{
   "sort": {
      "bizcircleCode": {
         "order": "asc",
         "mode":  "min"
      }
   }
}

分页子句

和 SQL 使用 LIMIT 关键字返回单 page 结果的方法相同，Elasticsearch 接受 from（初始结果数量）和 size（应该返回结果数量）参数：

{
   "size": 8,
   "from": 1
}

验证查询合法性

在实际应用中，查询可能变得非常的复杂，理解起来就有点困难了。不过可以使用validate-queryAPI来验证查询合法性。

GET /room/_validate/query
{
   "query": { "resblockName": { "match": "嘉" }}
}

合法的 query 返回信息：

{
   "valid":         false,
   "_shards": {
      "total":       1,
      "successful":  1,
      "failed":      0
   }
}

最后

别的业务线已经投入 Elasticsearch 使用有段时间了，找房业务线正由 Solr 切换为 Elasticsearch，各个系统有一个探索和磨合的过程。当然，Elasticsearch 我们已经服务化了，对 DSL 语法也进行了一些简化，同时支持了定制化业务。另外，使用 elasticsearch-sql 插件可以让 Elasticsearch 也支持 SQL 操作。

相关文章 »

Elasticsearch检索 — 聚合和LBS （2017-08-21）

使用Charles抓包

2017-07-22T01:58:18.000Z

Charles 是在 Mac 下常用的截取网络封包的工具（Win 环境也已支持），在移动端开发过程中，我们常需要截取网络包分析服务端的通讯协议。Charles 将自己设置成系统的网络访问代理服务器，不仅可以提供 SSL 代理，还支持流量的控制、支持重发网络请求、支持修改网络请求参数、支持网络响应截获并动态修改。

安装Charles

从 Charles 的官方网站下载最新的安装包，下载晚完成安装即可。

Charles 是付费软件，当然免费状态也可以使用。可以使用如下信息完成注册：

Registered Name: https://zhile.io
License Key: 48891cf209c6d32bf4

如果注册失败，可以尝试这种方法。

设置成系统代理服务器

由于 Charles 是通过将自己设置成代理服务器来完成封包截取的，所以第一步是需要将 Charles 设置成系统的代理服务器。

启动 Charles 后，菜单中的 “Proxy” -> “Windos Proxy（或者Mac OS X Proxy）”，来将 Charles 设置成系统代理。如下所示：

配置后，就可以在界面中看到截取的网络请求。但是，Chrome 和 Firefox 浏览器默认并不使用系统的代理服务器设置，所以需要将 Chrome 和 Firefox 设置成使用系统的代理服务器，或者直接设置成地址127.0.0.1：8888。

如果 Chrome 已安装了 Host Switch Plus 插件，则需要暂时关闭。

过滤网络请求

一般情况下，我们只需要监听指定服务器上发送的请求，可以使用如下办法解决：

方式1：在主界面 “Sequence” -> “Filter” 栏位置输入需要过滤的关键字即可。例如输入fanhaobai，则过滤输出只包含 fanhaobai 信息的请求。
方式2：在 Charles 的菜单栏选择 “Proxy” -> ”Recording Settings”，并选择 Include 栏，添加一条永久过滤规则，主要填入需要截取网站的协议、主机地址、端口号。
方式3：右击需要过滤的网络请求，选择 “Focus” 选项即可。

方式 1 和方式 3 可以快速地过滤临时性网络请求，使用方式 2 过滤永久性网络请求。

截取移动设备网络包

Charles 除了可以截取本地的网络包，作为代理服务器后，同样可以截取移动设备的网络请求包。

设置Charles

截取移动设备网络包时，需要先将 Charles 的代理功能打开。在 Charles 的菜单栏上选择 “Proxy” -> ”Proxy Settings”，填入默认代理端口 8888，且勾选 “Enable transparent HTTP proxying” 就完成了设置。如下图所示：

iPhone

首先，通过 Charles 的顶部菜单的 “Help” -> ”Local IP Address” 获取本地电脑的 IP 地址，例如我的本机电脑为192.168.1.102。

在 iPhone 的 ”设置“ -> ”无线局域网“ 中，对当前局域网连接设置 HTTP 代理（端口默认为 8888），如下图：

设置完成后，打开 iPhone 的任意程序，在 Charles 就可以弹出连接确认窗口，点击 ”Allow” 即可。

Android

在 Android 上操作同 iPhone，只是某些系统设置方式不一致而已。

截取 Https 包

如果需要截取并分析 Https 协议信息，需要安装 Charles 的 CA 证书。

本地通信信息

点击 Charles 的顶部菜单，选择 “Help” -> “SSL Proxying” -> “Install Charles Root Certificate”，即可完成证书的安装。如下图所示：

建议将证书安装在 ”受信任的根证书颁发机构“ 存储区。

特别说明，即使安装完证书后，Charles 默认是不会截取 Https 网络通讯的信息。对于需要截取分析站点 Https 请求，可以右击请求记录，选择 SSL proxy 即可，如图所示：

移动设备的通信信息

如果在 iPhone 或 Android 机器上截取 Https 协议的通讯内容，需要手机上安装相应的证书。点击 Charles 的顶部菜单，选择 “Help” -> “SSL Proxying” -> “Install Charles Root Certificate on a Mobile Device or Remote Browser”，然后按照 Charles 的提示的安装教程安装即可。如下图所示：

在上述截取移动设备网络包为手机设置好代理后，手机浏览器中访问地址http://chls.pro/ssl，即可打开证书安装的界面。安装完证书后，就可以截取手机上的 Https 通讯内容了。注意，同样需要在要截取的网络请求上右击，选择 SSL proxy 菜单项。

如果 SSL proxy 后出现如下错误：

可将证书设置为信任即可，例如 iPhone 下 “设置” -> “通用” -> “关于本机” -> “证书信任设置” 下：

模拟慢请求

在做 App 开发调试时，经常需要模拟慢请求或者高延迟网络，以测试应用在网络异常情况变现是否正常，而这使用 Charles 就轻松帮我们完成。

在 Charles 的菜单上，选择 “Proxy” -> ”Throttle Setting” 项，在弹出的窗口中，可以勾选上 “Enable Throttling”，并且可以设置 Throttle Preset 的类型。如下图所示：

当然可以通过 “Only for selected hosts” 项，只模拟指定站点的慢请求。

修改请求内容

有时为了调试服务端的接口，我们需要反复尝试不同参数的网络请求。Charles 可以方便地提供网络请求的修改和重发功能。只需在该网络请求上点击右键，选择 “Compose”，即可创建一个可编辑的网络请求。

我们可以修改该请求的任何信息，包括 URL 地址、端口、参数等，之后点击 “Execute” 即可发送该修改后的网络请求。Charles 支持我们多次修改和发送该请求，这对于我们和服务器端调试接口非常方便，如下图所示：

修改响应内容

有候为方便我们调试一些特殊情况，需要服务器返回一些特定的响应内容。例如数据为空或者数据异常的情况，部分耗时的网络请求超时的情况等。通常让服务端配合，构造相应的数据显得会比较麻烦，这个时候，使用 Charles 就可以满足我们的需求。

根据不同的场景需求，Charles 提供了 Map 功能、 Rewrite 功能以及 Breakpoints 功能，都可以达到修改服务器返回内容的目的。这三者在功能上的差异是：

Map 功能适合长期地将某一些请求重定向到另一个网络地址或本地文件。
Rewrite 功能适合对网络请求进行一些正则替换。
Breakpoints 功能适合做一些临时性的修改。

Map功能

Charles 的 Map 功能分 Map Remote 和 Map Local 两种。Map Remote 是将指定的网络请求重定向到另一个网址请求地址，而 Map Local 是将指定的网络请求重定向到本地文件。在 Charles 的菜单中，选择 “Tools” -> ”Map Remote” 或 “Map Local” ，即可进入到相应功能的设置页面。

对于 Map Remote 功能（选中 Enable Map Remote），我们需要填写网络重定向的源地址和目的地址，对于其他非必需字段可以留空。下图是一个示例，我将测试环境t.fanhaobai.com的请求重定向到了生产环境www.fanhaobai.com。

对于 Map Local 功能（选中 Enable Map Local），我们需要填写的重定向的源地址和本地的目标文件。对于有一些复杂的网络请求结果，我们可以先使用 Charles 提供的 “Save Response…” 功能，将请求结果保存到本地并稍加修改，成为我们的目标映射文件。

Rewrite功能

Rewrite 功能功能适合对某一类网络请求进行一些正则替换，以达到修改结果的目的。

例如，将服务端返回的www.fanhaobai.com全部替换为www.baidu.com，如下：

将响应中的www.fanhaobai.com全部替换为www.baidu.com。于是在 “Tools” -> “Rewrite” 下配置如下的规则：

选中 “Enable Rewrite” 启用 Rewrite 功能，响应如下：

Breakpoints功能

上面提供的 Rewrite 功能最适合做批量和长期的替换，但是很多时候，我们只是想临时修改一次网络请求结果，这个时候，我们最好使用 Breakpoints 功能。

在需要打断点的请求上右击并选择 “Breakpoints”，重新请求该地址，可以发现客户端被挂起，Charles 操作界面如下：

此时可以修改请求信息，但这里只修改响应信息，故点击 “Execute” 后选择 “Edit Response” 项，修改 title 为fanhaobai.com，如下：

继续点击 “Execute” ，可看见响应的 title 已经变为fanhaobai.com。

压力测试

我们可以使用 Charles 的 Repeat 功能来简单地测试服务器的并发处理能力。在想压测的网络请求上右击，然后选择 “Repeat Advanced” 项，如下所示：

这样我们就可以在上图的对话框中，选择压测的并发线程数以及压测次数，确定之后，即可开始压力测试了。

反向代理

Charles 的反向代理功能允许我们将本地的端口映射到远程的另一个端口上。

什么是B-树？

2017-07-08T06:56:57.000Z

原文：http://mp.weixin.qq.com/s/raIWLUM1kdbYvz0lTWPTvw

————————————

二叉查找树的结构：

第 1 次磁盘 IO：

第 2 次磁盘 IO：

第 3 次磁盘 IO：

第 4 次磁盘 IO：

下面来具体介绍一下 B- 树（Balance Tree），一个 m 阶的 B 树具有如下几个特征：

1.根结点至少有两个子女。
2.每个中间节点都包含 k-1 个元素和 k 个孩子，其中 m/2 <= k <= m。
3.每一个叶子节点都包含 k-1 个元素，其中 m/2 <= k <= m。
4.所有的叶子结点都位于同一层。
5.每个节点中的元素从小到大排列，节点当中 k-1 个元素正好是 k 个孩子包含的元素的值域分划。

第 1 次磁盘 IO：

在内存中定位（和 9 比较）：

第 2 次磁盘 IO：

在内存中定位（和 2，6 比较）：

第 3 次磁盘 IO：

在内存中定位（和 3，5 比较）：

自顶向下查找 4 的节点位置，发现 4 应当插入到节点元素 3，5 之间。

节点 3，5 已经是两元素节点，无法再增加。父亲节点 2， 6 也是两元素节点，也无法再增加。根节点 9 是单元素节点，可以升级为两元素节点。于是拆分节点 3，5 与节点 2，6，让根节点 9 升级为两元素节点 4，9。节点 6 独立为根节点的第二个孩子。

自顶向下查找元素 11 的节点位置。

删除 11 后，节点 12 只有一个孩子，不符合 B 树规范。因此找出 12,13,15 三个节点的中位数 13，取代节点 12，而节点 12 自身下移成为第一个孩子。（这个过程称为左旋）

漫画算法系列 »

按照奖品概率分布抽奖的实现

2017-05-18T04:20:23.000Z

需求：首先用户通过以一定方式（好友点赞等）开启抽奖资格，然后按照用户 100% 中奖概率进行抽奖，且系统的发放奖品需要按照各个奖品整体的期望中奖比例来进行分布，最后用户抽中奖品调用第三方发放接口发放奖品并记录保存，另有些奖品存在发放数量限制。

问题分析

整个抽奖过程是同步进行，由于前置了开启抽奖资格保护，会避免用户集中进行抽奖，故系统并发量并不会太高。突出的问题主要有以下几个：

1）由于同步调用第三方接口发放奖品，奖品可能发放失败；
2）有一些奖品存在数量限制，可能已经发放完；
3）系统要求用户 100% 抽中奖品；
4）系统要求各个奖品总的发放情况符合预期的比例分布；

解决方案

针对以上突出问题，给出针对的解决办法。

问题1：采用带有次数限制的重试机制，降低奖品发放接口发放失败情况，同时捕获异常来应对接口返回异常信息。重试机制失败则自动重新进行一轮按概率抽奖，依次类推并做重发次数限制；
问题2：奖品数量在奖品发放端进行限制。因为系统存在数量限制的奖品期望发放比例较低，每轮抽中这些奖品概率也较低，所以可以采用若奖品已发放完，则自动重新进行一轮按概率抽奖，依次类推并做重发次数限制；
问题3：尽管有发放接口的重试机制和自动多轮按概率抽奖机制，也可能存在抽取奖品失败的情况，这里采用一种特定奖品作为兜底的办法，当然兜底奖品也有重试机制，使用户抽中概率接近 100%；
问题4：因为重试机制失败或者抽取到已经发送完毕的奖品时，会自动重新进行下一轮抽奖，由于规则也是按照概率抽奖，所以不影响各个奖品总的比例分布情况；

编码

按概率抽奖

核心思想是采用随机函数 mt_rand() 来模拟用户抽奖。

奖品信息如下：

//所有奖品信息
$allPrizes = [
  'jd'    => ['name' => '京东券', 'probability' => 30],
  'film'  => ['name' => '电影票', 'probability' => 10],
  'tb'    => ['name' => '淘宝券', 'probability' => 60],
]

方式一

这是一个比较中规中矩的方式，主要思想 是：将所有奖品按照期望比例分布，一段一段小区间分布到 1~~100 这个区间，然后随机一个 1~~100 的随机数，如果这个随机数落在某段区间，则表示抽取对应区间的奖品。

1            30     10                    60
1|-----------|------|----------------------|100
     京东券    电影票          淘宝券

代码如下：

/**
 * 按照概率抽取一个奖品, 返回奖品
 * @param   array      $prizes     所有奖品的probability概率总和应该为100
 * @return  mixed
 */
private function randPrize(array $prizes)
{
    //总概率基数
    $totalProbability = array_sum(array_column(array_values($prizes), 'probability'));
    if (100 !== $totalProbability) {
        throw new Exception('invalid probability config');
    }
    $rand = mt_rand(1, 100);
    $cursor = 0;
    $id = '';
    while(list($key, $item) = each($prizes)) {
        if ($rand > $cursor && $rand <= $cursor + $item['probability']) {
            $id = $key;
            break;
        }
        $cursor += $item['probability'];
    }
    unset($prizes[$id]['probability']);

    return $prizes[$id] + ['id' => $id];
}

方式二

该方式如果直接看代码比较难理解。主要思想：按照给定顺序（按照奖品配置顺序），先后一个一个抽取奖品，直到抽中一个奖品为止，抽中后续奖品的概率的前提是没有抽中当前奖品，多次抽取概率应该相乘。

例如：

次数       奖品       概率    基数        中奖概率                     未中奖概率
 1        京东券      30     100         30/100                      70/100
 2        电影票      10      70      (70/100)*(10/70)           (70/100)*(60/70)
 3        淘宝券      60      60     (70/100)*(60/70)*(1)       1-(70/100)*(60/70)*(1)

/**
 * 按照概率抽取一个奖品, 返回奖品, 
 * @param   array    $prizes    参与抽奖的奖品信息, 所有奖品的probability概率总和应该为100
 * @return  array
 */
private function randPrize(array $prizes)
{
    //总概率基数
    $totalProbability = array_sum(array_column(array_values($prizes), 'probability'));
    if (100 !== $totalProbability) {
        throw new Exception('invalid probability config');
    }
    //可以考虑按照概率倒序排序
    /*uasort($prizes, function(array $a, array $b) {
        if ($a['probability'] == $b['probability']) return 0;
        return $a['probability'] > $b['probability'] ? -1 : 1;
    });*/
    //按照奖品顺序依次模拟抽中奖品
    $id = '';
    foreach ($prizes as $key => $item) {
        $rand = mt_rand(1, $totalProbability);    //本次抽奖的基数
        if ($rand <= $item['probability']) {      //表示抽中
            $id = $key;
            break;
        } else {
            $totalProbability -= $item['probability'];  //后续奖品基数减去抽过的概率, 因为抽中后一个奖品的前提是抽不中前一些奖品
        }
    }
    unset($prizes[$id]['probability']);
    return $prizes[$id] + ['id' => $id];
}

抽中奖品

主要包含重试机制、自动重新一轮按照概率抽奖机制、兜底机制的实现。

/**
 * 抽奖
 * @param   array   $allPrizes
 * @return  mixed
 */
public function draw($allPrizes)
{
    $tryTimes = 0;
    $outPrize = [];
    $prize = [];

    //如果抽到有数量限制奖品且奖品也已经抽完或者抽取失败, 最多抽奖次数
    while ($tryTimes < 4) {
        $tryTimes++;
        //按照概率抽取
        $prize =  $this->randPrize($allPrizes);
        //模拟发放奖品方法
        $outPrize = $this->getOnePrize($prize['id']);
        //抽中退出
        if (!empty($outPrize)) {
            break;
        }
    }

    echo '尝试按照概率抽取次数:' , $tryTimes, PHP_EOL;

    //多次抽奖都抽中已经抽完的奖品, 则用兜底奖品兜底
    $tryTimes = 0;
    while (!$outPrize && $tryTimes < 2) {
        $tryTimes++;
$prize = $allPrizes['default'] + ['id' => 'default'];
        $outPrize = $this->getOnePrize('default');
    }

    echo '兜底抽取次数:' , $tryTimes, PHP_EOL;

    if (!$outPrize) {
        //兜底失败, 可能是券达到上限, 或者接口down了
        return false;
    } else {
        //合并奖品信息
        $outPrize = $outPrize + $prize;
    }

    return $outPrize;
}

验证

概率分布

抽样方法

public function sample($all, $times)
{
    $out = [];
    $count = $times;
    if ($times > 1000000) return;
    while ($times) {
        $times--;
        $prize = $this->draw($all);
        if (!isset($out[$prize['id']])) {
            $out[$prize['id']] = 0;
        }
        $out[$prize['id']]++;
    }
    array_walk($out, function(&$value, $key) use ($count) {
        $value = ($value / $count * 100);
    });
 
    ksort($out);
    return $out;
}

抽样结果

//期望概率
array(3) {
  ["film"] => int(10)
  ["jd"] => int(30)
  ["tb"] => int(60)
}
//抽样2000次
array(3) {
  ["film"] => string(4) "9.8"
  ["jd"] => string(6) "31.35"
  ["tb"] => string(6) "58.85"
}

异常处理机制

尝试按照概率抽取次数: 3
兜底抽取次数: 0
抽中奖品为：array(3) {
  ["name"] => string(20) "淘宝50元消费券"
  ["content"] => string(12) "WD84-3233-21"
  ["id"] => string(2) "tb"
}

求非负数组元素组成的最大字符串

2017-04-03T05:43:56.000Z

问题叙述：将一个非负元素数组中的所有元素排列组合在一起，找出值最大的那个排列情况。例如 [0, 9, 523, 94, 10, 4]，排列组合后值最大数为：9945234100。

本文废话较多，可以直接跳转到编码实现部分。

背景描述

这是我遇到的一道笔试题。首次遇见我也是很懵，当时我的第一感觉就是排序，但是没有及时理清里面的规律，导致后面并没有解答出此题。

问题分析

确定输入值

该问题描述很简单，也给出了测试用例，需求很明白。但是还需要注意问题背后隐藏的一些问题。

可确定输入的情况大致为：

数组元素都为非负数，但可能为 0；
数组长度并没有确定，长度可能很大。这里假设操作不溢出；
数组元素的位数不确定，用例只涉及到 2 位数，需要考虑多位数的情况。这里假设操作不溢出；

寻找规律

面试时请教了一下面试官，面试官的思路：

最简单办法就是枚举所有可能的排列组合情况，然后求排列组合后的最大值；再就是寻找组合的规律，满足什么条件的元素排列在前。

当然这只是面试官提供的一些解决思路，付诸于实践还需要探索。在复试前的一天晚上我再次翻出这个问题，并找到了一些思路。

就拿问题中的用例 [0, 9, 523, 94, 10, 4] 来说，需要找出的结果为：9,94,523,4,10,0（为了方便说明，用”,“分割了数组元素）。

先将复杂问题简单化处理，首先尝试使用 排序算法 来分析过程。分析 9 和 94 的排列，为什么 9 排列在 94 前？那是因为这 2 个数存在 2 种排列情况，既_ 9_94_ 和_ 9_49_，很明显 9_94_ 排列大于 _9_49 排列，所以需要将 9 排列在 94 前，反之则需要交换元素位置。如果采用这样规则处理，是在 2 个元素之间进行枚举排列情况，且单次枚举情况限定在了 2 种，降低了问题的复杂程度并易于编码实现，后续可以直接使用排序方法来多次重复这种 2 个元素之间的单次枚举动作。

说明：符号“_”为占位符，表示该位置可能还存在其他元素，但不影响当前两个元素的前后排列顺序。后续出现该符号将不再说明。

总之，我认为该问题是排序问题的一个变种情况，同排序问题不同的是 比较规则。这里不是直接比较 2 个元素值大小，而是比较 2 个元素排列组合后值的大小。

实现思路

经过上述分析，问题规律已经掌握清楚，这里整理出实现的思路。

整体思路

确定使用排序算法实现；
与传统排序不同之处为元素之间的比较规则；

排序过程

使用冒泡排序来说明上述用例的排序过程。

比较规则

本问题的排序比较规则可以描述为：假设参与比较的两个元素为 A、B（初始时 A 在 B 前，排序结果从左至右为由大到小），比较时如果排列 _A_B_ 小于排列 _B_A_，A 和 B 则交换位置，反之不交换。

编码实现

比较规则

/**
 * 比较规则
 * @param   string    $a
 * @param   string    $b
 * @return  int
 */
function cmp($a, $b) {
    if ($a == $b) {
        return 0;
    }
    return $a . $b > $b . $a ? -1 : 1;
}

冒泡排序

/**
 * 冒泡排序
 * @param   array    $Arr   待排序数组
 * @return  array
 */
function bubble_sort(array $Arr) {
    $length = count($Arr);
if ($length < 2) {
        return $Arr;
    }

    for ($i = 1, $change = true; $i <= $length && $change; $i++) {
        $change = false;
        for ($j = $length - 1; $j > $i - 1; $j--) {
            if (cmp($Arr[$j - 1], $Arr[$j]) > 0) {
                $temp = $Arr[$j - 1];
                $Arr[$j - 1] = $Arr[$j];
                $Arr[$j] = $temp;
                $change = true;
            }
        }
    }
    return $Arr;
}

/**
 * 寻找非零元素数组中所有元素排列组合后的最大值
 * @param   array     $Arr        待排序数组
 * @param   string    $method     排序方法
 * @return  mixed
 */
function array_form_max_str(array $Arr, $method = 'bubble') {
    //参数校验
    if (!is_array($Arr)) return false;
    foreach ($Arr as $value) {
        if ($value < 0) return false;
    }
    //排序算法
    switch ($method) {
        case 'quick' :
            usort($Arr, "cmp");           //快速排序
            break;
        case 'bubble' :
            $Arr = bubble_sort($Arr);     //冒泡排序
            break;
        default : break;
    }
    //拼接
    return implode('', $Arr);
}

快速排序

由于 PHP 中 sort 排序函数采用快速排序算法，这里直接使用之。

/**
 * 寻找非零元素数组中所有元素排列组合后的最大值
 * @param   array     $Arr        待排序数组
 * @param   string    $method     排序方法
 * @return  mixed
 */
function array_form_max_str(array $Arr, $method = 'quick') {
    //参数校验
    if (!is_array($Arr)) return false;
    foreach ($Arr as $value) {
        if ($value < 0) return false;
    }
    //排序算法
    switch ($method) {
        case 'quick' :                   //快速排序
            usort($Arr, "cmp");
            break;
        case 'bubble' :
            $Arr = bubble_sort($Arr);    //冒泡排序
            break;
        default : break;
    }
    //拼接
    return implode('', $Arr);
}

用例测试

这里只对快速排序方法使用 2 组测试用例并列举如下。

测试代码

$Arr = [20,913,223,91,20,3];
echo '数组为[', implode(',', $Arr), ']', PHP_EOL;
echo '最大排列组合为：', array_form_max_str($Arr), PHP_EOL;

测试结果

//第1组用例
数组为[0,9,523,94,10,4]
最大排列组合为：9945234100

//第2组用例
数组为[20,913,223,91,20,3]
最大排列组合为：9191332232020

写在最后

经过深入分析问题的本质，也使得我对与排序算法有了更深入的认识，更算是一个巩固。同时，正是由于我尝试着去解决这个问题，才使得我在后面的复试环节中面试官再次提出相同问题时，给出了一个满意的解决方案。

相关文章 »

王者编程大赛之一（2017-12-05）

漫画欣赏：Linux内核到底长啥样？

2017-03-24T16:00:00.000Z

原文：https://linux.cn/article-8290-1.html

今天，我来为大家解读一幅来自 TurnOff.us 的漫画 “InSide The Linux Kernel” 。 TurnOff.us是一个极客漫画网站，作者Daniel Stori 画了一些非常有趣的关于编程语言、Web、云计算、Linux 相关的漫画。今天解读的便是其中的一篇。

在开始，我们先来看看这幅漫画的全貌！

这幅漫画是以一个房子的侧方刨面图来绘画的。使用这样的一个房子来代表 Linux 内核。

地基

作为一个房子，最重要的莫过于其地基，在这个图片里，我们也从最下面的地基开始看起：

地基（底层）由一排排的文件柜组成，井然有序，文件柜里放置着“文件”——电脑中的文件。左上角，有一只胸前挂着 421 号牌的小企鹅，它表示着 PID（进程 IDProcess ID）为 421 的进程，它正在查看文件柜中的文件，这代表系统中正有一个进程在访问文件系统。在右下角有一只小狗，它是看门狗 watchdog ，这代表对文件系统的监控。

一层（地面层）##

看完了地基，接下来我们来看地基上面的一层，都有哪些东西。

在这一层，最引人瞩目的莫过于中间的一块垫子，众多小企鹅在围着着桌子坐着。这个垫子的区域代表进程表。

左上角有一个小企鹅，站着，仿佛在说些什么这显然是一位家长式的人物，不过看起来周围坐的那些小企鹅不是很听话——你看有好多走神、自顾自聊天的——“喂喂，说你呢，哇塞娃（171），转过身来”。它代表着 Linux 内核中的初始化（init）进程，也就是我们常说的 PID 为 1 的进程。桌子上坐的小企鹅都在等待状态 wait 中，等待工作任务。

瞧瞧，垫子（进程表）旁边也有一只小狗，它会监控小企鹅的状态（监控进程），当小企鹅们不听话时，它就会汪汪地叫喊起来。

在这层的左侧，有一只号牌为 1341 的小企鹅，守在门口，门上写着 80，说明这个 PID 为 1341 的小企鹅负责接待 80 端口，也就是我们常说的 HTTP （网站）的端口。小企鹅头上有一片羽毛，这片羽毛大有来历，它是著名的 HTTP 服务器 Apache 的 Logo。喏，就是这只：

向右看，我们可以看到这里仍有一扇门，门上写着 21，但是，看起来这扇门似乎年久失修，上面的门牌号都歪了，门口也没人守着。看起来这个 21 端口的 FTP 协议有点老旧了，目前用的人也比以前少了，以至于这里都没人接待了。

而在最右侧的一个门牌号 22 的们的待遇就大为不同，居然有一只带着墨镜的小企鹅在守着，看起来好酷啊，它是黑衣人叔叔吗？为什么要这么酷的一个企鹅呢，因为 22 端口是 SSH 端口，是一个非常重要的远程连接端口，通常通过这个端口进行远程管理，所以对这个端口进来的人要仔细审查。

它的身上写着 52，说明它是第 52 个小企鹅。

在图片的左上角，有一个向下台阶。这个台阶是底层（地基）的文件系统中的，进程们可以通过这个台阶，到文件系统中去读取文件，进行操作。

在这一层中，有一个身上写着 217 的小企鹅，他正满头大汗地看着自己的手表。这只小企鹅就是定时任务（Crontab），他会时刻关注时间，查看是否要去做某个工作。

在图片的中部，有两个小企鹅扛着管道（PipeLine）在行走，一只小企鹅可以把自己手上的东西通过这个管道，传递给后面的小企鹅。不过怎么看起来前面这种（男？）企鹅累得满头大汗，而后面那只（女？）企鹅似乎游刃有余——喂喂，前面那个，裤子快掉了~

在这一层还有另外的一个小企鹅，它手上拿着一杯红酒，身上写着 411，看起来有点不胜酒力。它就是红酒（Wine）小企鹅,它可以干（执行）一些来自 Windows 的任务。

跃层

在一层之上，还有一个跃层，这里有很多不同的屏幕，每个屏幕上写着 TTY（这就是对外的终端）。比如说最左边 tty4 上输入了“fre”——这是想输入“freshmeat…”么：d ；它旁边的 tty2 和 tty3 就正常多了，看起来是比较正常的命令；tty7 显示的图形界面嗳，对，图形界面（X Window）一般就在 7 号终端；tty5 和 tty6 是空的，这表示这两个终端没人用。等等，tty1 呢？

tty（终端）是对外沟通的渠道之一，但是，不是每一个进程都需要 tty，某些进程可以直接通过其他途径（比如端口）来和外部进行通信，对外提供服务的，所以，这一层不是完整的一层，只是个跃层。

好了，我们有落下什么吗？

这小丑是谁啊？

啊哈，我也不知道，或许是病毒？你说呢？

启用Hexo开源博客系统

2017-02-28T16:00:00.000Z

前段时间博客一直使用 FireKylin，总体感觉挺好，但是扩展开发和社区是弱点。而 Hexo 最大特点为纯静态博客系统，同时社区支持也比较好，故我转而投向了 Hexo 的怀抱。

安装

Hexo 如官方介绍一样，安装方便快捷。安装前请确保 Node 和 Nginx 环境已经存在，需要安装可以参考 CentOS 6 安装 Node 和 Nginx 安装。

只需使用如下命令即可安装 Hexo。

$ npm install hexo-cli -g
$ hexo init blog
$ cd blog
$ npm install
$ hexo server

安装完成后目录结构如下：

├── _config.yml             # 主配置文件
├── package.json            # 应用程序的信息
├── scaffolds               # 模版文件夹，新建文章时根据这些模版来生成文章的.md文件
├── source                  # 资源文件夹
|   ├── _drafts
|   └── _posts
└── themes                  # 主题文件夹

Hexo 默认启动 4000 端口，使用浏览器访问 http://localhost:4000，即可看见 Hexo 美丽的面容。

说明：Nginx 配置站点根目录为public。

使用

关于 Hexo 更详细的使用技巧，见官网文档，这里只列举常用的使用方法。

更换主题

Hexo 提供的可选主题比较多，总有一款你如意的，我这里主题选择了 hexo-theme-yilia，没有为什么，就是看起来舒服而已，后续相关配置也是基于该主题。

找到喜欢的一款后，使用如下命令安装主题：

# 进入博客目录
$ cd yourblog
# 克隆主题源码到hexo的themes文件夹下
$ git clone https://github.com/fan-haobai/hexo-theme-yilia.git themes/yilia

最后一步，在_config.yml配置中启用新主题。

theme: yilia

关于主题的相关配置，参考主题源码中的 README.md 文档。

hexo-theme-yilia 主题我做了较多的修改，如果你觉得我的修改也适合你，那么你只要 pull 下来即可，而不需要再做自定义修改部分的修改。

写文章

这里只列举我使用过的方法，更多文章的使用方法，见这里。

1）新建文章

当需要写文章时，使用如下命令新建文章，会在资源文件夹中生成与 title 对应的 md 文件。

$ hexo new [layout] </span></span><br></pre></td></tr></table></figure><p>md 文件就是 Markdown 格式的文章表述。格式大致为：</p><figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">title: Hello World</span><br><span class="line">date: 2013/7/13 20:46:25</span><br><span class="line">---                                      # 分隔符</span><br><span class="line"><span class="meta prompt_"># </span><span class="language-bash">以下为文章的Markdown内容</span></span><br></pre></td></tr></table></figure><p>文件最上方以<code>---</code>为分隔符，分隔符以上为 Front-matter，用于指定与文章相关的基本信息，分隔符以下才为文章的内容区域。</p><p>2） Front-matter</p><p>Front-matter 内容如下：</p><figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">layout                 布局</span><br><span class="line">title                  标题</span><br><span class="line">date                   建立日期</span><br><span class="line">updated                更新日期</span><br><span class="line">comments               是否开启文章的评论功能</span><br><span class="line">tags                   标签</span><br><span class="line">categories             分类</span><br><span class="line">permalink              覆盖文章网址</span><br></pre></td></tr></table></figure><p>其中 title、date、tags、categories 这 4 项，在新建文章时需要进行设置，其他项采用默认值即可，不需要在每篇文章中进行设置，故可以将这 4 项基本设置移到模板文件<code>scaffolds\post.md</code>中，如下：</p><figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">---</span><br><span class="line">title: {{ title }}</span><br><span class="line">date: {{ date }}</span><br><span class="line">tags:</span><br><span class="line">categories:</span><br><span class="line">---</span><br></pre></td></tr></table></figure><p>这样在新建文章时，就会自动在文章 md 文件中加入 4 项基本设置。</p><p>特别说明，文章中添加了分类和标签后， Hexo 会自动生成分类页面和统计分类的文章数。关于分类和标签的使用，如下：</p><figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">categories:           # 分类存在顺序关系</span><br><span class="line">- 语言                 # 1级分类</span><br><span class="line">- PHP                 # 2级分类</span><br><span class="line">- PDO                 # 3级分类    </span><br><span class="line">tags:                 # 标签为无序</span><br><span class="line">- PHP                 # 标签1</span><br><span class="line">- PDO                 # 标签2</span><br></pre></td></tr></table></figure><p>3） 正文</p><p>文章正文使用 Markdown 格式即可，我使用的 Markdown 编辑器主要有 <a href="http://typora.io/">Typora — Win版</a> 和 <a href="https://maxiang.io/">马克飞象 — 网页版</a>。</p><p>Typora 和 马克飞象 的对比：</p><ul><li>Typora 可以在本地使用相对路径预览文章图片，文章中插入图片方法，<a href="#">见配置部分</a>。</li><li>马克飞象在线编辑，可以同印象笔记时时同步，但是想预览图片，就必须是线上图片地址。</li></ul><p>使用编辑器预览编辑完文章后，导出 md 文件替换新建文章时生成的同名 md 文件即可。</p><p>编辑完文章后，使用<code>hexo s</code>命令即可实时预览到文章效果。</p><h2 id="发布"><a href="#发布" class="headerlink" title="发布"></a>发布</h2><p>文章的新增和编辑都是在资源文件夹下（<code>source</code>）操作，完成后需要发布才能生成静态文件（<code>public</code>），进而才能通过浏览器直接访问。</p><p>发布更新命令如下：</p><figure class="highlight shell"><table><tr><td class="code"><pre><span class="line"><span class="meta prompt_">$ </span><span class="language-bash">hexo generate</span></span><br><span class="line"><span class="meta prompt_"># </span><span class="language-bash">可以简写为</span></span><br><span class="line"><span class="meta prompt_">$ </span><span class="language-bash">hexo g</span></span><br></pre></td></tr></table></figure><p>发布后，<code>public</code>文件夹更新到最新状态，此时即可直接访问。</p><h1 id="插件"><a href="#插件" class="headerlink" title="插件"></a>插件</h1><h2 id="搜索"><a href="#搜索" class="headerlink" title="搜索"></a>搜索</h2><p>安装 <a href="https://github.com/PaicHyperionDev/hexo-generator-search">hexo-generator-search</a>，在<code>_config.yml</code>中添加如下配置代码：</p><figure class="highlight yaml"><table><tr><td class="code"><pre><span class="line"><span class="attr">search:</span></span><br><span class="line">  <span class="attr">path:</span> <span class="string">search.xml</span></span><br><span class="line">  <span class="attr">field:</span> <span class="string">all</span></span><br></pre></td></tr></table></figure><h2 id="RSS"><a href="#RSS" class="headerlink" title="RSS"></a>RSS</h2><p>安装 <a href="https://github.com/hexojs/hexo-generator-feed">hexo-generator-feed</a>，并按照说明配置（atom.xml 的链接写在<code>source/_data/link.json</code>的 social 项中，一般无需更改）</p><h2 id="jsonContent"><a href="#jsonContent" class="headerlink" title="jsonContent"></a>jsonContent</h2><p>安装 <a href="https://github.com/alexbruno/hexo-generator-json-content">hexo-generator-json-content</a>，即可生成所有文章的 json 描述。需在<code>_config.yml</code>中添加如下配置代码：</p><figure class="highlight yaml"><table><tr><td class="code"><pre><span class="line"><span class="attr">jsonContent:</span></span><br><span class="line">  <span class="attr">meta:</span> <span class="literal">false</span></span><br><span class="line">  <span class="attr">pages:</span> <span class="literal">false</span></span><br><span class="line">  <span class="attr">posts:</span></span><br><span class="line">    <span class="attr">title:</span> <span class="literal">true</span></span><br><span class="line">    <span class="attr">date:</span> <span class="literal">true</span></span><br><span class="line">    <span class="attr">path:</span> <span class="literal">true</span></span><br><span class="line">    <span class="attr">text:</span> <span class="literal">false</span></span><br><span class="line">    <span class="attr">raw:</span> <span class="literal">false</span></span><br><span class="line">    <span class="attr">content:</span> <span class="literal">false</span></span><br><span class="line">    <span class="attr">slug:</span> <span class="literal">false</span></span><br><span class="line">    <span class="attr">updated:</span> <span class="literal">false</span></span><br><span class="line">    <span class="attr">comments:</span> <span class="literal">false</span></span><br><span class="line">    <span class="attr">link:</span> <span class="literal">false</span></span><br><span class="line">    <span class="attr">permalink:</span> <span class="literal">false</span></span><br><span class="line">    <span class="attr">excerpt:</span> <span class="literal">false</span></span><br><span class="line">    <span class="attr">categories:</span> <span class="literal">false</span></span><br><span class="line">    <span class="attr">tags:</span> <span class="literal">true</span></span><br></pre></td></tr></table></figure><h2 id="Sitemap"><a href="#Sitemap" class="headerlink" title="Sitemap"></a>Sitemap</h2><p>安装 <a href="https://github.com/hexojs/hexo-generator-sitemap">hexo-generator-sitemap</a>，并在<code>_config.yml</code>中添加如下配置代码：</p><figure class="highlight yaml"><table><tr><td class="code"><pre><span class="line"><span class="attr">sitemap:</span></span><br><span class="line">  <span class="attr">path:</span> <span class="string">sitemap.xml</span></span><br></pre></td></tr></table></figure><p>在使用 Hexo 生成器时会自动生成最新的站点地图 <a href="/sitemap.xml">sitemap.xml</a>文件。</p><h1 id="配置"><a href="#配置" class="headerlink" title="配置"></a>配置</h1><p>更多的配置信息，<a href="https://hexo.io/zh-cn/docs/configuration.html">见这里</a>。我这里只列举比较重要的配置。</p><h2 id="打开文章资源文件夹功能"><a href="#打开文章资源文件夹功能" class="headerlink" title="打开文章资源文件夹功能"></a>打开文章资源文件夹功能</h2><p>在 Hexo 中，相对路径是针对资源文件夹<code>source</code>来讲，所以文章的静态图片应放置于资源文件夹下。</p><p>可以将所有文章的静态图片统一放置于<code>source/images</code>下，但是这样不方便于管理，推荐方法是将每篇文章的图片放置于与该文章同名的资源文件下，然后使用相对路径引用即可。</p><p>在配置文件<code>_config.yml</code>中开启<code>post_asset_folder</code>项，即更改为：</p><figure class="highlight yaml"><table><tr><td class="code"><pre><span class="line"><span class="attr">post_asset_folder:</span> <span class="literal">true</span></span><br></pre></td></tr></table></figure><p>开启该项配置后，Hexo 将会在你每一次通过<code>hexo new [layout] <title></code>命令创建新文章时自动创建一个文件名同 md 文件的文件夹。将所有与你的文章有关的资源放在这个关联文件夹中之后，就可以通过相对路径来引用它们。</p><p>写文章时你只需在 Markdown 中插入相对 md 文件的 <strong>相对路径</strong> 的图片即可，<a href="#">hexo-asset-image</a> 自动转化为网站 <strong>绝对路径</strong>。此时，可以直接使用 Hexo 提供的标签<code>asset_img</code>来插入图片，但是这样违背了 Markdown 语法，无法及时预览，不便于编辑文章。</p><p>可以通过以下 Markdown 语法在文章中插入图片，这种方式同时也支持本地 Markdown 编辑器实时预览。</p><figure class="highlight shell"><table><tr><td class="code"><pre><span class="line">![alt](/post_title/image_name)</span><br><span class="line"><span class="meta prompt_"># </span><span class="language-bash">post_title为与文章.md同名的资源文件夹名</span></span><br><span class="line"><span class="meta prompt_"># </span><span class="language-bash">image_name为图片的文件名</span></span><br></pre></td></tr></table></figure><h2 id="URL静态化"><a href="#URL静态化" class="headerlink" title="URL静态化"></a>URL静态化</h2><p>Hexo 默认 URL 地址为<code>year/month/day/title/</code>形式，而这种形式并不友好，需更改为<code>year/month/title.html</code>形式。这里我已经将<code>source</code>目录下的 md 文件按<code>year/month</code>手动归档了，所以 Hexo 发布时只需要<code>title.html</code>这部分。配置如下：</p><figure class="highlight yaml"><table><tr><td class="code"><pre><span class="line"><span class="attr">permalink:</span> <span class="string">:title.html</span></span><br></pre></td></tr></table></figure><h2 id="去除代码块行号"><a href="#去除代码块行号" class="headerlink" title="去除代码块行号"></a>去除代码块行号</h2><p>修改<code>_config.yml</code>配置项如下：</p><figure class="highlight yaml"><table><tr><td class="code"><pre><span class="line"><span class="attr">highlight:</span></span><br><span class="line">  <span class="attr">line_number:</span> <span class="literal">false</span></span><br></pre></td></tr></table></figure><h1 id="部署"><a href="#部署" class="headerlink" title="部署"></a>部署</h1><p>如果采用本地编辑博客，博客部署在远程服务器上，那么你就需要部署，才能同步本地更新到远程服务器。</p><h2 id="官方推荐"><a href="#官方推荐" class="headerlink" title="官方推荐"></a>官方推荐</h2><p>Hexo 提供了 5 种部署方案，<a href="https://hexo.io/zh-cn/docs/deployment.html">见这里</a>，这里只介绍以下 2 种：</p><p>1） Git</p><p>安装 <a href="https://github.com/hexojs/hexo-deployer-git">hexo-deployer-git</a>。</p><p><code>_config.yml</code>配置如下：</p><figure class="highlight yaml"><table><tr><td class="code"><pre><span class="line"><span class="attr">deploy:</span></span><br><span class="line">  <span class="attr">type:</span> <span class="string">git</span></span><br><span class="line">  <span class="attr">repo:</span> <span class="string"><repository</span> <span class="string">url></span>                     <span class="comment"># 库地址</span></span><br><span class="line">  <span class="attr">branch:</span> [<span class="string">branch</span>]                           <span class="comment"># 分支名称</span></span><br><span class="line">  <span class="attr">message:</span> [<span class="string">message</span>]                         <span class="comment"># 提交信息</span></span><br></pre></td></tr></table></figure><p>该方案适用于采用 Github Pages 托管博客的用户，当然使用服务器搭建博客的用户可以使用 Webhook 方案来实现。</p><p>2） Rsync</p><p>安装 <a href="https://github.com/hexojs/hexo-deployer-rsync">hexo-deployer-rsync</a>。</p><p> <code>_config.yml</code>配置如下：</p><figure class="highlight yaml"><table><tr><td class="code"><pre><span class="line"><span class="attr">deploy:</span></span><br><span class="line">  <span class="attr">type:</span> <span class="string">rsync</span></span><br><span class="line">  <span class="attr">host:</span> <span class="string"><host></span>                         <span class="comment"># 远程主机的地址                       </span></span><br><span class="line">  <span class="attr">user:</span> <span class="string"><user></span>                         <span class="comment"># 使用者名称</span></span><br><span class="line">  <span class="attr">root:</span> <span class="string"><root></span>                         <span class="comment"># 远程主机的根目录</span></span><br><span class="line">  <span class="attr">port:</span> [<span class="string">port</span>]                         <span class="comment"># 端口，rsync监听端口</span></span><br><span class="line">  <span class="attr">delete:</span> [<span class="literal">true</span><span class="string">|false</span>]                 <span class="comment"># 是否删除远程主机上的旧文件</span></span><br><span class="line">  <span class="attr">verbose:</span> [<span class="literal">true</span><span class="string">|false</span>]                <span class="comment"># 显示调试信息</span></span><br><span class="line">  <span class="attr">ignore_errors:</span> [<span class="literal">true</span><span class="string">|false</span>]          <span class="comment"># 忽略错误</span></span><br></pre></td></tr></table></figure><p>显然，该方案适用于使用服务器搭建博客的用户，但是需要在本地安装 Rsync 客户端（<a href="http://pan.baidu.com/s/1jHTNpVC">cwRsync</a>）。同时，需要在服务器搭建和配置 Rsync 服务，<a href="#">见这里</a>。</p><blockquote><p>我尝试在 Win10 下实现这种方案，但是遇到了很多问题，例如 rsync 服务端采用 SSH 认证方式，但是 cwRsync 使用的 SSH 客户端呆板的从<code>/home/.ssh</code>目录查找 SSH 配置和公钥，很悲剧 Win10 下无法识别这个路径，导致无法免密登录 SSH，Rsync 同步也无法进行。</p></blockquote><p>总之，部署的目的，就是将发布生成的静态文件<code>public</code>更新到服务器上，如果能实现这个目的，途径倒是无所谓了。</p><h2 id="我的方案"><a href="#我的方案" class="headerlink" title="我的方案"></a>我的方案</h2><p>上述推荐部署方案，明显的缺点是本地需要部署 Hexo 环境，无法实现随时随地的更新博客。为了方便写作，我的部署方案见 <a href="https://www.fanhaobai.com/2018/03/hexo-deploy.html">我的博客发布上线方案 — Hexo</a>。</p><h1 id="自定义修改——非必须"><a href="#自定义修改——非必须" class="headerlink" title="自定义修改——非必须"></a>自定义修改——非必须</h1><h2 id="更好地支持Shell代码高亮"><a href="#更好地支持Shell代码高亮" class="headerlink" title="更好地支持Shell代码高亮"></a>更好地支持Shell代码高亮</h2><p>由于 <a href="#">highlight.js</a> 对 Shell 语法高亮解析效果并不理想，为此我对 <a href="https://github.com/fan-haobai/highlight.js/blob/master/src/languages/shell.js">languages/shell.js</a> 部分做了修改来更好地支持 Shell，你只需要 <a href="https://github.com/fan-haobai/highlight.js">pull</a> 并替换掉原 <a href="#">languages/shell.js</a> 文件即可。</p><figure class="highlight shell"><table><tr><td class="code"><pre><span class="line"><span class="meta prompt_">$ </span><span class="language-bash">git <span class="built_in">clone</span> https://github.com/fan-haobai/highlight.js.git</span></span><br><span class="line"><span class="meta prompt_">$ </span><span class="language-bash"><span class="built_in">cp</span> highlight.js/src/languages/shell.js node_modules/highlight.js/lib/languages/shell.js</span></span><br></pre></td></tr></table></figure><p>并将 <a href="#">shell.js</a> 中的如下部分：</p><figure class="highlight js"><table><tr><td class="code"><pre><span class="line"><span class="keyword">function</span>(<span class="params">hljs</span>)</span><br></pre></td></tr></table></figure><p>修改为：</p><figure class="highlight js"><table><tr><td class="code"><pre><span class="line"><span class="variable language_">module</span>.<span class="property">exports</span> = <span class="keyword">function</span>(<span class="params">hljs</span>)</span><br></pre></td></tr></table></figure><h2 id="评论"><a href="#评论" class="headerlink" title="评论"></a>评论</h2><p>换来换去，最后还是觉得只有 <a href="https://disqus.com/">Disqus</a> 合适，但是需要先解决被墙的问题，不过 <a href="https://github.com/fooleap">fooleap</a> 已经提供了一个较好的解决方案—— <a href="https://github.com/fooleap/disqus-php-ap">disqus-php-api</a>。你只需要 <a href="https://github.com/fan-haobai/disqus-php-api">pull</a> 代码到境外服务器，部署一个 PHP 服务即可。</p><p>我部署后域名为 <a href="https://disqus.fanhaobai.com/">disqus.fanhaobai.com</a>。首先在<code>layout/_partial/article.ejs</code>文件中追加以下内容：</p><figure class="highlight js"><table><tr><td class="code"><pre><span class="line"><% <span class="keyword">if</span> (!index && post.<span class="property">comments</span>){ %></span><br><span class="line">  <% <span class="keyword">if</span> (theme.<span class="property">disqus</span> || theme.<span class="property">disqus</span>.<span class="property">shortname</span>){ %></span><br><span class="line">  <%- <span class="title function_">partial</span>(<span class="string">'post/disqus'</span>, {</span><br><span class="line">      <span class="attr">title</span>: post.<span class="property">title</span>,</span><br><span class="line">      <span class="attr">url</span>: config.<span class="property">url</span>+<span class="title function_">url_for</span>(post.<span class="property">path</span>)</span><br><span class="line">    }) %></span><br><span class="line">  <% } %></span><br><span class="line"><% } %></span><br></pre></td></tr></table></figure><p>然后，在<code>layout/_partial/post</code>目录下创建<code>disqus.ejs</code>文件，内容如下：</p><figure class="highlight js"><table><tr><td class="code"><pre><span class="line"><div id=<span class="string">"disqus_thread"</span>></div></span><br><span class="line"><span class="language-xml"><span class="tag"><<span class="name">link</span> <span class="attr">rel</span>=<span class="string">"stylesheet"</span> <span class="attr">href</span>=<span class="string">"/disqus.css"</span>></span></span></span><br><span class="line"><span class="language-xml"><span class="tag"><<span class="name">script</span> <span class="attr">src</span>=<span class="string">"/disqus.js"</span>></span><span class="tag"></<span class="name">script</span>></span></span></span><br><span class="line"><span class="language-xml"><span class="tag"><<span class="name">script</span>></span><span class="language-javascript"></span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">  (<span class="keyword">function</span> (<span class="params"></span>) {</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">    <span class="keyword">var</span> disqus = <span class="keyword">new</span> <span class="title function_">iDisqus</span>(<span class="string">'disqus_thread'</span>, {</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">      <span class="attr">forum</span>: <span class="string">'<%= theme.disqus.shortname %>'</span>,</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">      <span class="attr">site</span>: <span class="string">'<%= config.url %>'</span>,</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">      <span class="attr">api</span>: <span class="string">'<%= theme.disqus.api %>'</span>,</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">      <span class="attr">url</span>: <span class="string">'<%= url %>'</span>,</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">      <span class="attr">mode</span>: <span class="number">2</span>,</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">      <span class="attr">timeout</span>: <span class="number">3000</span>,</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">      <span class="attr">init</span>: <span class="literal">true</span>,</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">      <span class="attr">autoCreate</span>: <span class="literal">true</span>,</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">      <span class="attr">relatedType</span>: <span class="literal">false</span></span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">    });</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">    disqus.<span class="title function_">count</span>();</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">  })();</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml"></span><span class="tag"></<span class="name">script</span>></span></span></span><br></pre></td></tr></table></figure><p>最后，在<code>_config.yml</code>增加如下配置：</p><figure class="highlight yaml"><table><tr><td class="code"><pre><span class="line"><span class="attr">disqus:</span></span><br><span class="line">  <span class="attr">shortname:</span> <span class="string">'fanhaobai'</span></span><br><span class="line">  <span class="attr">api:</span> <span class="string">'//disqus.fanhaobai.com'</span></span><br></pre></td></tr></table></figure><blockquote><p>有关 Disqus 更详细的配置，见 <a href="https://github.com/fan-haobai/disqus-php-api#disqus-%E8%AE%BE%E7%BD%AE">Disqus 设置</a> 部分。</p></blockquote><h2 id="百度统计"><a href="#百度统计" class="headerlink" title="百度统计"></a>百度统计</h2><p>首先，在<code>layout/_partial/after-footer.ejs</code>文件中追加如下代码：</p><figure class="highlight js"><table><tr><td class="code"><pre><span class="line"><%- <span class="title function_">partial</span>(<span class="string">'baidu-analytics'</span>) %></span><br></pre></td></tr></table></figure><p>并在<code>layout/_partial</code>目录下创建<code>baidu-analytics.ejs</code>文件，内容为：</p><figure class="highlight js"><table><tr><td class="code"><pre><span class="line"><% <span class="keyword">if</span> (theme.<span class="property">baidu_analytics</span>){ %></span><br><span class="line"><span class="language-xml"><span class="tag"><<span class="name">script</span>></span><span class="language-javascript"></span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml"><span class="keyword">var</span> _hmt = _hmt || [];</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">(<span class="keyword">function</span>(<span class="params"></span>) {</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">  <span class="keyword">var</span> hm = <span class="variable language_">document</span>.<span class="title function_">createElement</span>(<span class="string">"script"</span>);</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">  hm.<span class="property">src</span> = <span class="string">"https://hm.baidu.com/hm.js?<%= theme.baidu_analytics %>"</span>;</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">  <span class="keyword">var</span> s = <span class="variable language_">document</span>.<span class="title function_">getElementsByTagName</span>(<span class="string">"script"</span>)[<span class="number">0</span>]; </span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">  s.<span class="property">parentNode</span>.<span class="title function_">insertBefore</span>(hm, s);</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">})();</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml"></span><span class="tag"></<span class="name">script</span>></span></span></span><br><span class="line"><% } %></span><br></pre></td></tr></table></figure><p>然后，在配置文件<code>_config.yml</code>中，增加如下配置信息：</p><figure class="highlight js"><table><tr><td class="code"><pre><span class="line"># 百度分析<span class="title class_">Uid</span>，若为空则不启用</span><br><span class="line"><span class="attr">baidu_analytics</span>: 9f0ecfa73797e6a907d8ea6a285df6a5</span><br></pre></td></tr></table></figure><h2 id="百度主动推送"><a href="#百度主动推送" class="headerlink" title="百度主动推送"></a>百度主动推送</h2><p>为了更好的收录本站文章，这里引进了百度 <a href="http://zhanzhang.baidu.com/college/courseinfo?id=267&page=2">主动推送功能</a>，只需添加如下 JS代码，每当文章被浏览时都会自动向百度提交链接，这种方式以用户为驱动，较为方便和实用。</p><p>在主题模板文件<code>layout/_partial/article.ejs</code>中，追加以下代码：</p><figure class="highlight js"><table><tr><td class="code"><pre><span class="line"><% <span class="keyword">if</span> (!index){ %></span><br><span class="line"><span class="language-xml"><span class="tag"><<span class="name">script</span>></span><span class="language-javascript"></span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">  (<span class="keyword">function</span> (<span class="params"></span>) {</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">    <span class="keyword">var</span> bp = <span class="variable language_">document</span>.<span class="title function_">createElement</span>(<span class="string">'script'</span>);</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">    <span class="keyword">var</span> curProtocol = <span class="variable language_">window</span>.<span class="property">location</span>.<span class="property">protocol</span>.<span class="title function_">split</span>(<span class="string">':'</span>)[<span class="number">0</span>];</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">    <span class="keyword">if</span> (curProtocol === <span class="string">'https'</span>) {</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">        bp.<span class="property">src</span> = <span class="string">'https://zz.bdstatic.com/linksubmit/push.js'</span></span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">    } <span class="keyword">else</span> {</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">        bp.<span class="property">src</span> = <span class="string">'http://push.zhanzhang.baidu.com/push.js'</span></span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">    }</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">    <span class="keyword">var</span> s = <span class="variable language_">document</span>.<span class="title function_">getElementsByTagName</span>(<span class="string">"script"</span>)[<span class="number">0</span>];</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">    s.<span class="property">parentNode</span>.<span class="title function_">insertBefore</span>(bp, s)</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml">  })();</span></span></span><br><span class="line"><span class="language-javascript"><span class="language-xml"></span><span class="tag"></<span class="name">script</span>></span></span></span><br><span class="line"><% } %></span><br></pre></td></tr></table></figure><p>到这里，也终于算是搭建结束了。至于 404 页面打算采用 <a href="http://www.qq.com/404/">腾讯的公益404页面</a> 来做，<a href="https://www.fanhaobai.com/404.html">见这里</a>。</p><p><strong>更新 <a href="#">»</a></strong></p><ul><li><a href="https://github.com/fan-haobai/hexo-theme-yilia">主题更换为 hexo-theme-yilia</a><span>（2017-10-30）</span></li><li><a href="#">自定义分享</a><span>（2017-11-28）</span></li><li><a href="#">去除百度统计</a><span>（2018-07-04）</span></li><li><a href="#%E8%AF%84%E8%AE%BA">科学使用 Disqus</a><span>（2018-07-04）</span></li><li><a href="#%E6%9B%B4%E5%A5%BD%E5%9C%B0%E6%94%AF%E6%8C%81Shell%E4%BB%A3%E7%A0%81%E9%AB%98%E4%BA%AE">更好地支持 Shell 代码高亮</a><span>（2018-09-09）</span></li></ul><p><strong>相关文章 <a href="#">»</a></strong></p><ul><li><a href="https://www.fanhaobai.com/2018/03/hexo-deploy.html">我的博客发布上线方案 — Hexo</a><span>（2018-03-03）</span></li></ul>
</article>
<article>
<h1>PHP生成随机红包算法</h1>
<p>2017-02-12T16:07:06.000Z</p>
<blockquote><p>原文：<a href="http://www.lcode.cc/2016/12/24/rand_ward.html">http://www.lcode.cc/2016/12/24/rand_ward.html</a></p></blockquote><p>前一阵公司业务有一个生成红包的需求，分为固定红包和随机红包两种，固定红包没什么好说的了，随机红包要求指定最小值，和最大值，必须至少有一个最大值，可以没有最小值，但任何红包不能小于最小值。</p><p><span id="more"></span></p><p>以前从来没做过这方面，有点懵B，于是去百度了一番，结果发现能找到的红包算法都有各种各样的 bug，要么会算出负值，要么超过最大值，所以决定自己撸一套出来。</p><h1 id="基本思路"><a href="#基本思路" class="headerlink" title="基本思路"></a>基本思路</h1><p>在随机数生成方面，我借鉴了这位博主 <a href="http://www.cnblogs.com/hanyouchun/p/5074923.html">＠悲惨的大爷</a> 的思路：</p><blockquote><p><strong>原文</strong>：比如要把 1 个红包分给 N 个人，实际上就是相当于要得到 N 个百分比数据 条件是这 N 个百分比之和 = 100/100。这 N 个百分比的平均值是 1/N。 并且这 N 个百分比数据符合一种正态分布（多数值比较靠近平均值）。<br><strong>解读</strong>：比如我有 1000 块钱，发 50 个红包，就先随机出 50 个数，然后算出这 50 个数的均值 avg，用 avg/(1/N)，就得到了一个基数 mixrand ，然后用随机出的那 50 个数分别去除以 mixrand ，得到每个数相对基数的百分比 randVal ，然后用 randVal 乘以 1000 块钱，就可以得到每个红包的具体金额了。</p></blockquote><p>还是不太清楚咋回事？没关系，我们一起撸代码！</p><h1 id="算法实现"><a href="#算法实现" class="headerlink" title="算法实现"></a>算法实现</h1><p>Talk is cheap, show me your code!</p><h2 id="核心生成算法"><a href="#核心生成算法" class="headerlink" title="核心生成算法"></a>核心生成算法</h2><figure class="highlight php"><table><tr><td class="code"><pre><span class="line"><span class="meta"><?php</span></span><br><span class="line"><span class="comment">/*</span></span><br><span class="line"><span class="comment"> * Author:xx_lufei</span></span><br><span class="line"><span class="comment"> * Time:2016年9月14日09:55:36</span></span><br><span class="line"><span class="comment"> * Note:红包生成随机算法</span></span><br><span class="line"><span class="comment"> */</span></span><br><span class="line"><span class="class"><span class="keyword">class</span> <span class="title">Reward</span></span></span><br><span class="line"><span class="class"></span>{</span><br><span class="line">    <span class="keyword">public</span> <span class="variable">$rewardMoney</span>;        <span class="comment">#红包金额、单位元</span></span><br><span class="line">    <span class="keyword">public</span> <span class="variable">$rewardNum</span>;          <span class="comment">#红包数量</span></span><br><span class="line"></span><br><span class="line">    <span class="comment">#执行红包生成算法</span></span><br><span class="line">    <span class="keyword">public</span> <span class="function"><span class="keyword">function</span> <span class="title">splitReward</span>(<span class="params"><span class="variable">$rewardMoney</span>, <span class="variable">$rewardNum</span>, <span class="variable">$max</span>, <span class="variable">$min</span></span>)</span></span><br><span class="line"><span class="function">    </span>{</span><br><span class="line">        <span class="comment">#传入红包金额和数量，因为小数在计算过程中会出现很大误差，所以我们直接把金额放大100倍，后面的计算全部用整数进行</span></span><br><span class="line">        <span class="variable">$min</span> = <span class="variable">$min</span> * <span class="number">100</span>;</span><br><span class="line">        <span class="variable">$max</span> = <span class="variable">$max</span> * <span class="number">100</span>;</span><br><span class="line">        <span class="comment">#预留出一部分钱作为误差补偿，保证每个红包至少有一个最小值</span></span><br><span class="line">        <span class="variable language_">$this</span>->rewardMoney = <span class="variable">$rewardMoney</span> * <span class="number">100</span> - <span class="variable">$rewardNum</span> * <span class="variable">$min</span>;</span><br><span class="line">        <span class="variable language_">$this</span>->rewardNum = <span class="variable">$rewardNum</span>;</span><br><span class="line">        <span class="comment">#计算出发出红包的平均概率值、精确到小数4位。</span></span><br><span class="line">        <span class="variable">$avgRand</span> = <span class="number">1</span> / <span class="variable language_">$this</span>->rewardNum;</span><br><span class="line">        <span class="variable">$randArr</span> = <span class="keyword">array</span>();</span><br><span class="line">        <span class="comment">#定义生成的数据总合sum</span></span><br><span class="line">        <span class="variable">$sum</span> = <span class="number">0</span>;</span><br><span class="line">        <span class="variable">$t_count</span> = <span class="number">0</span>;</span><br><span class="line">        <span class="keyword">while</span> (<span class="variable">$t_count</span> < <span class="variable">$rewardNum</span>) {</span><br><span class="line">            <span class="comment">#随机产出四个区间的额度</span></span><br><span class="line">            <span class="variable">$c</span> = <span class="title function_ invoke__">rand</span>(<span class="number">1</span>, <span class="number">100</span>);</span><br><span class="line">            <span class="keyword">if</span> (<span class="variable">$c</span> < <span class="number">15</span>) {</span><br><span class="line">                <span class="variable">$t</span> = <span class="title function_ invoke__">round</span>(<span class="title function_ invoke__">sqrt</span>(<span class="title function_ invoke__">mt_rand</span>(<span class="number">1</span>, <span class="number">1500</span>)));</span><br><span class="line">            } <span class="keyword">else</span> <span class="keyword">if</span> (<span class="variable">$c</span> < <span class="number">65</span>) {</span><br><span class="line">                <span class="variable">$t</span> = <span class="title function_ invoke__">round</span>(<span class="title function_ invoke__">sqrt</span>(<span class="title function_ invoke__">mt_rand</span>(<span class="number">1500</span>, <span class="number">6500</span>)));</span><br><span class="line">            } <span class="keyword">else</span> <span class="keyword">if</span> (<span class="variable">$c</span> < <span class="number">95</span>) {</span><br><span class="line">                <span class="variable">$t</span> = <span class="title function_ invoke__">round</span>(<span class="title function_ invoke__">sqrt</span>(<span class="title function_ invoke__">mt_rand</span>(<span class="number">6500</span>, <span class="number">9500</span>)));</span><br><span class="line">            } <span class="keyword">else</span> {</span><br><span class="line">                <span class="variable">$t</span> = <span class="title function_ invoke__">round</span>(<span class="title function_ invoke__">sqrt</span>(<span class="title function_ invoke__">mt_rand</span>(<span class="number">9500</span>, <span class="number">10000</span>)));</span><br><span class="line">            }</span><br><span class="line">            ++<span class="variable">$t_count</span>;</span><br><span class="line">            <span class="variable">$sum</span> += <span class="variable">$t</span>;</span><br><span class="line">            <span class="variable">$randArr</span>[] = <span class="variable">$t</span>;</span><br><span class="line">        }</span><br><span class="line"></span><br><span class="line">        <span class="comment">#计算当前生成的随机数的平均值，保留4位小数</span></span><br><span class="line">        <span class="variable">$randAll</span> = <span class="title function_ invoke__">round</span>(<span class="variable">$sum</span> / <span class="variable">$rewardNum</span>, <span class="number">4</span>);</span><br><span class="line"></span><br><span class="line">        <span class="comment">#为将生成的随机数的平均值变成我们要的1/N，计算一下每个随机数要除以的总基数mixrand。此处可以约等处理，产生的误差后边会找齐</span></span><br><span class="line">        <span class="comment">#总基数 = 均值/平均概率</span></span><br><span class="line">        <span class="variable">$mixrand</span> = <span class="title function_ invoke__">round</span>(<span class="variable">$randAll</span> / <span class="variable">$avgRand</span>, <span class="number">4</span>);</span><br><span class="line"></span><br><span class="line">        <span class="comment">#对每一个随机数进行处理，并乘以总金额数来得出这个红包的金额。</span></span><br><span class="line">        <span class="variable">$rewardArr</span> = <span class="keyword">array</span>();</span><br><span class="line">        <span class="keyword">foreach</span> (<span class="variable">$randArr</span> <span class="keyword">as</span> <span class="variable">$key</span> => <span class="variable">$randVal</span>) {</span><br><span class="line">            <span class="comment">#单个红包所占比例randVal</span></span><br><span class="line">            <span class="variable">$randVal</span> = <span class="title function_ invoke__">round</span>(<span class="variable">$randVal</span> / <span class="variable">$mixrand</span>, <span class="number">4</span>);</span><br><span class="line">            <span class="comment">#算出单个红包金额</span></span><br><span class="line">            <span class="variable">$single</span> = <span class="title function_ invoke__">floor</span>(<span class="variable">$this</span>->rewardMoney * <span class="variable">$randVal</span>);</span><br><span class="line">            <span class="comment">#小于最小值直接给最小值</span></span><br><span class="line">            <span class="keyword">if</span> (<span class="variable">$single</span> < <span class="variable">$min</span>) {</span><br><span class="line">                <span class="variable">$single</span> += <span class="variable">$min</span>;</span><br><span class="line">            }</span><br><span class="line">            <span class="comment">#大于最大值直接给最大值</span></span><br><span class="line">            <span class="keyword">if</span> (<span class="variable">$single</span> > <span class="variable">$max</span>) {</span><br><span class="line">                <span class="variable">$single</span> = <span class="variable">$max</span>;</span><br><span class="line">            }</span><br><span class="line">            <span class="comment">#将红包放入结果数组</span></span><br><span class="line">            <span class="variable">$rewardArr</span>[] = <span class="variable">$single</span>;</span><br><span class="line">        }</span><br><span class="line"></span><br><span class="line">        <span class="comment">#对比红包总数的差异、将差值放在第一个红包上</span></span><br><span class="line">        <span class="variable">$rewardAll</span> = <span class="title function_ invoke__">array_sum</span>(<span class="variable">$rewardArr</span>);</span><br><span class="line">        <span class="comment">#此处应使用真正的总金额rewardMoney，$rewardArr[0]可能小于0</span></span><br><span class="line">        <span class="variable">$rewardArr</span>[<span class="number">0</span>] = <span class="variable">$rewardMoney</span> * <span class="number">100</span> - (<span class="variable">$rewardAll</span> - <span class="variable">$rewardArr</span>[<span class="number">0</span>]);</span><br><span class="line">        <span class="comment">#第一个红包小于0时,做修正</span></span><br><span class="line">        <span class="keyword">if</span> (<span class="variable">$rewardArr</span>[<span class="number">0</span>] < <span class="number">0</span>) {</span><br><span class="line">            <span class="title function_ invoke__">rsort</span>(<span class="variable">$rewardArr</span>);</span><br><span class="line">            <span class="variable language_">$this</span>-><span class="title function_ invoke__">add</span>(<span class="variable">$rewardArr</span>, <span class="variable">$min</span>);</span><br><span class="line">        }</span><br><span class="line"></span><br><span class="line">        <span class="title function_ invoke__">rsort</span>(<span class="variable">$rewardArr</span>);</span><br><span class="line">        <span class="comment">#随机生成的最大值大于指定最大值</span></span><br><span class="line">        <span class="keyword">if</span> (<span class="variable">$rewardArr</span>[<span class="number">0</span>] > <span class="variable">$max</span>) {</span><br><span class="line">            <span class="comment">#差额</span></span><br><span class="line">            <span class="variable">$diff</span> = <span class="number">0</span>;</span><br><span class="line">            <span class="keyword">foreach</span> (<span class="variable">$rewardArr</span> <span class="keyword">as</span> <span class="variable">$k</span> => &<span class="variable">$v</span>) {</span><br><span class="line">                <span class="keyword">if</span> (<span class="variable">$v</span> > <span class="variable">$max</span>) {</span><br><span class="line">                    <span class="variable">$diff</span> += <span class="variable">$v</span> - <span class="variable">$max</span>;</span><br><span class="line">                    <span class="variable">$v</span> = <span class="variable">$max</span>;</span><br><span class="line">                } <span class="keyword">else</span> {</span><br><span class="line">                    <span class="keyword">break</span>;</span><br><span class="line">                }</span><br><span class="line">            }</span><br><span class="line">            <span class="variable">$transfer</span> = <span class="title function_ invoke__">round</span>(<span class="variable">$diff</span> / (<span class="variable">$this</span>->rewardNum - <span class="variable">$k</span> + <span class="number">1</span>));</span><br><span class="line">            <span class="variable language_">$this</span>-><span class="title function_ invoke__">diff</span>(<span class="variable">$diff</span>, <span class="variable">$rewardArr</span>, <span class="variable">$max</span>, <span class="variable">$min</span>, <span class="variable">$transfer</span>, <span class="variable">$k</span>);</span><br><span class="line">        }</span><br><span class="line">        <span class="keyword">return</span> <span class="variable">$rewardArr</span>;</span><br><span class="line">    }</span><br><span class="line"></span><br><span class="line">    <span class="comment">#处理所有超过最大值的红包</span></span><br><span class="line">    <span class="keyword">public</span> <span class="function"><span class="keyword">function</span> <span class="title">diff</span>(<span class="params"><span class="variable">$diff</span>, &<span class="variable">$rewardArr</span>, <span class="variable">$max</span>, <span class="variable">$min</span>, <span class="variable">$transfer</span>, <span class="variable">$k</span></span>)</span></span><br><span class="line"><span class="function">    </span>{</span><br><span class="line">        <span class="comment">#将多余的钱均摊给小于最大值的红包</span></span><br><span class="line">        <span class="keyword">for</span> (<span class="variable">$i</span> = <span class="variable">$k</span>; <span class="variable">$i</span> < <span class="variable language_">$this</span>->rewardNum; <span class="variable">$i</span>++) {</span><br><span class="line">            <span class="comment">#造随机值</span></span><br><span class="line">            <span class="keyword">if</span> (<span class="variable">$transfer</span> > <span class="variable">$min</span> * <span class="number">20</span>) {</span><br><span class="line">                <span class="variable">$aa</span> = <span class="title function_ invoke__">rand</span>(<span class="variable">$min</span>, <span class="variable">$min</span> * <span class="number">20</span>);</span><br><span class="line">                <span class="keyword">if</span> (<span class="variable">$i</span> % <span class="number">2</span>) {</span><br><span class="line">                    <span class="variable">$transfer</span> += <span class="variable">$aa</span>;</span><br><span class="line">                } <span class="keyword">else</span> {</span><br><span class="line">                    <span class="variable">$transfer</span> -= <span class="variable">$aa</span>;</span><br><span class="line">                }</span><br><span class="line">            }</span><br><span class="line">            <span class="keyword">if</span> (<span class="variable">$rewardArr</span>[<span class="variable">$i</span>] + <span class="variable">$transfer</span> > <span class="variable">$max</span>) <span class="keyword">continue</span>;</span><br><span class="line">            <span class="keyword">if</span> (<span class="variable">$diff</span> - <span class="variable">$transfer</span> < <span class="number">0</span>) {</span><br><span class="line">                <span class="variable">$rewardArr</span>[<span class="variable">$i</span>] += <span class="variable">$diff</span>;</span><br><span class="line">                <span class="variable">$diff</span> = <span class="number">0</span>;</span><br><span class="line">                <span class="keyword">break</span>;</span><br><span class="line">            }</span><br><span class="line">            <span class="variable">$rewardArr</span>[<span class="variable">$i</span>] += <span class="variable">$transfer</span>;</span><br><span class="line">            <span class="variable">$diff</span> -= <span class="variable">$transfer</span>;</span><br><span class="line">        }</span><br><span class="line">        <span class="keyword">if</span> (<span class="variable">$diff</span> > <span class="number">0</span>) {</span><br><span class="line">            <span class="variable">$i</span>++;</span><br><span class="line">            <span class="variable language_">$this</span>-><span class="title function_ invoke__">diff</span>(<span class="variable">$diff</span>, <span class="variable">$rewardArr</span>, <span class="variable">$max</span>, <span class="variable">$min</span>, <span class="variable">$transfer</span>, <span class="variable">$k</span>);</span><br><span class="line">        }</span><br><span class="line">    }</span><br><span class="line"></span><br><span class="line">    <span class="comment">#第一个红包小于0,从大红包上往下减</span></span><br><span class="line">    <span class="keyword">public</span> <span class="function"><span class="keyword">function</span> <span class="title">add</span>(<span class="params">&<span class="variable">$rewardArr</span>, <span class="variable">$min</span></span>)</span></span><br><span class="line"><span class="function">    </span>{</span><br><span class="line">        <span class="keyword">foreach</span> (<span class="variable">$rewardArr</span> <span class="keyword">as</span> &<span class="variable">$re</span>) {</span><br><span class="line">            <span class="variable">$dev</span> = <span class="title function_ invoke__">floor</span>(<span class="variable">$re</span> / <span class="variable">$min</span>);</span><br><span class="line">            <span class="keyword">if</span> (<span class="variable">$dev</span> > <span class="number">2</span>) {</span><br><span class="line">                <span class="variable">$transfer</span> = <span class="variable">$min</span> * <span class="title function_ invoke__">floor</span>(<span class="variable">$dev</span> / <span class="number">2</span>);</span><br><span class="line">                <span class="variable">$re</span> -= <span class="variable">$transfer</span>;</span><br><span class="line">                <span class="variable">$rewardArr</span>[<span class="variable language_">$this</span>->rewardNum - <span class="number">1</span>] += <span class="variable">$transfer</span>;</span><br><span class="line">            } <span class="keyword">elseif</span> (<span class="variable">$dev</span> == <span class="number">2</span>) {</span><br><span class="line">                <span class="variable">$re</span> -= <span class="variable">$min</span>;</span><br><span class="line">                <span class="variable">$rewardArr</span>[<span class="variable language_">$this</span>->rewardNum - <span class="number">1</span>] += <span class="variable">$min</span>;</span><br><span class="line">            } <span class="keyword">else</span> {</span><br><span class="line">                <span class="keyword">break</span>;</span><br><span class="line">            }</span><br><span class="line">        }</span><br><span class="line">        <span class="keyword">if</span> (<span class="variable">$rewardArr</span>[<span class="variable language_">$this</span>->rewardNum - <span class="number">1</span>] > <span class="variable">$min</span> || <span class="variable">$rewardArr</span>[<span class="variable language_">$this</span>->rewardNum - <span class="number">1</span>] == <span class="variable">$min</span>) {</span><br><span class="line">            <span class="keyword">return</span>;</span><br><span class="line">        } <span class="keyword">else</span> {</span><br><span class="line">            <span class="variable language_">$this</span>-><span class="title function_ invoke__">add</span>(<span class="variable">$rewardArr</span>, <span class="variable">$min</span>);</span><br><span class="line">        }</span><br><span class="line">    }</span><br><span class="line">}</span><br></pre></td></tr></table></figure><h2 id="细节考虑"><a href="#细节考虑" class="headerlink" title="细节考虑"></a>细节考虑</h2><p>下边这段代码用来控制具体的业务逻辑，按照具体的需求，留出固定的最大值、最小值红包的金额等；在代码中调用生成红包的方法时 splitReward($total, $num,$max - 0.01, $min)，我传入的最大值减了 0.01，这样就保证了里面生成的红包最大值绝对不会超过我们设置的最大值。 </p><figure class="highlight php"><table><tr><td class="code"><pre><span class="line"><span class="meta"><?php</span> </span><br><span class="line"><span class="class"><span class="keyword">class</span> <span class="title">CreateReward</span></span>{</span><br><span class="line">    <span class="comment">/*</span></span><br><span class="line"><span class="comment">     * 生成红包</span></span><br><span class="line"><span class="comment">     * author    xx     2016年9月23日13:53:38</span></span><br><span class="line"><span class="comment">     * <span class="doctag">@param</span>   int          $total               红包总金额</span></span><br><span class="line"><span class="comment">     * <span class="doctag">@param</span>   int          $num                 红包总数量</span></span><br><span class="line"><span class="comment">     * <span class="doctag">@param</span>   int          $max                 红包最大值</span></span><br><span class="line"><span class="comment">     * </span></span><br><span class="line"><span class="comment">     */</span></span><br><span class="line">    <span class="keyword">public</span> <span class="function"><span class="keyword">function</span> <span class="title">random_red</span>(<span class="params"><span class="variable">$total</span>, <span class="variable">$num</span>, <span class="variable">$max</span>, <span class="variable">$min</span></span>)</span></span><br><span class="line"><span class="function">    </span>{</span><br><span class="line">        <span class="comment">#总共要发的红包金额，留出一个最大值;</span></span><br><span class="line">        <span class="variable">$total</span> = <span class="variable">$total</span> - <span class="variable">$max</span>;</span><br><span class="line">        <span class="variable">$reward</span> = <span class="keyword">new</span> <span class="title class_">Reward</span>();</span><br><span class="line">        <span class="variable">$result_merge</span> = <span class="variable">$reward</span>-><span class="title function_ invoke__">splitReward</span>(<span class="variable">$total</span>, <span class="variable">$num</span>, <span class="variable">$max</span> - <span class="number">0.01</span>, <span class="variable">$min</span>);</span><br><span class="line">        <span class="title function_ invoke__">sort</span>(<span class="variable">$result_merge</span>);</span><br><span class="line">        <span class="variable">$result_merge</span>[<span class="number">1</span>] = <span class="variable">$result_merge</span>[<span class="number">1</span>] + <span class="variable">$result_merge</span>[<span class="number">0</span>];</span><br><span class="line">        <span class="variable">$result_merge</span>[<span class="number">0</span>] = <span class="variable">$max</span> * <span class="number">100</span>;</span><br><span class="line">        <span class="keyword">foreach</span> (<span class="variable">$result_merge</span> <span class="keyword">as</span> &<span class="variable">$v</span>) {</span><br><span class="line">            <span class="variable">$v</span> = <span class="title function_ invoke__">floor</span>(<span class="variable">$v</span>) / <span class="number">100</span>;</span><br><span class="line">        }</span><br><span class="line">        <span class="keyword">return</span> <span class="variable">$result_merge</span>;</span><br><span class="line">    }</span><br><span class="line">}</span><br></pre></td></tr></table></figure><h1 id="实例测试"><a href="#实例测试" class="headerlink" title="实例测试"></a>实例测试</h1><h2 id="基础代码"><a href="#基础代码" class="headerlink" title="基础代码"></a>基础代码</h2><p>先设置好各种初始值。</p><figure class="highlight php"><table><tr><td class="code"><pre><span class="line"><span class="meta"><?php</span></span><br><span class="line"><span class="comment">/**</span></span><br><span class="line"><span class="comment"> * Created by PhpStorm.</span></span><br><span class="line"><span class="comment"> * User: lufei</span></span><br><span class="line"><span class="comment"> * Date: 2017/1/4</span></span><br><span class="line"><span class="comment"> * Time: 22:49</span></span><br><span class="line"><span class="comment"> */</span></span><br><span class="line"><span class="title function_ invoke__">header</span>(<span class="string">'content-type:text/html;charset=utf-8'</span>);</span><br><span class="line"><span class="title function_ invoke__">ini_set</span>(<span class="string">'memory_limit'</span>, <span class="string">'128M'</span>);</span><br><span class="line"></span><br><span class="line"><span class="keyword">require_once</span>(<span class="string">'CreateReward.php'</span>);</span><br><span class="line"><span class="keyword">require_once</span>(<span class="string">'Reward.php'</span>);</span><br><span class="line"></span><br><span class="line"><span class="variable">$total</span> = <span class="number">50000</span>;</span><br><span class="line"><span class="variable">$num</span> = <span class="number">300000</span>;</span><br><span class="line"><span class="variable">$max</span> = <span class="number">50</span>;</span><br><span class="line"><span class="variable">$min</span> = <span class="number">0.01</span>;</span><br><span class="line"></span><br><span class="line"><span class="variable">$create_reward</span> = <span class="keyword">new</span> <span class="title class_">CreateReward</span>();</span><br></pre></td></tr></table></figure><h2 id="性能测试"><a href="#性能测试" class="headerlink" title="性能测试"></a>性能测试</h2><p>因为 memory_limit 的限制，所以只测了 5 次的均值，结果都在 1.6s 左右。</p><figure class="highlight php"><table><tr><td class="code"><pre><span class="line"><span class="keyword">for</span>(<span class="variable">$i</span>=<span class="number">0</span>; <span class="variable">$i</span><<span class="number">5</span>; <span class="variable">$i</span>++) {</span><br><span class="line">    <span class="variable">$time_start</span> = <span class="title function_ invoke__">microtime_float</span>();</span><br><span class="line">    <span class="variable">$reward_arr</span> = <span class="variable">$create_reward</span>-><span class="title function_ invoke__">random_red</span>(<span class="variable">$total</span>, <span class="variable">$num</span>, <span class="variable">$max</span>, <span class="variable">$min</span>);</span><br><span class="line">    <span class="variable">$time_end</span> = <span class="title function_ invoke__">microtime_float</span>();</span><br><span class="line">    <span class="variable">$time</span>[] = <span class="variable">$time_end</span> - <span class="variable">$time_start</span>;</span><br><span class="line">}</span><br><span class="line"><span class="keyword">echo</span> <span class="title function_ invoke__">array_sum</span>(<span class="variable">$time</span>)/<span class="number">5</span>;</span><br><span class="line"><span class="function"><span class="keyword">function</span> <span class="title">microtime_float</span>(<span class="params"></span>)</span></span><br><span class="line"><span class="function"></span>{</span><br><span class="line">    <span class="keyword">list</span>(<span class="variable">$usec</span>, <span class="variable">$sec</span>) = <span class="title function_ invoke__">explode</span>(<span class="string">" "</span>, <span class="title function_ invoke__">microtime</span>());</span><br><span class="line">    <span class="keyword">return</span> ((<span class="keyword">float</span>)<span class="variable">$usec</span> + (<span class="keyword">float</span>)<span class="variable">$sec</span>);</span><br><span class="line">}</span><br></pre></td></tr></table></figure><p>运行结果：</p><p></p><h2 id="数据检查"><a href="#数据检查" class="headerlink" title="数据检查"></a>数据检查</h2><p><strong>1） 数值是否有误</strong></p><p>检测有没有负值，有没有最大值，最大值有多少个，有没有小于最小值的值。</p><figure class="highlight php"><table><tr><td class="code"><pre><span class="line"><span class="variable">$reward_arr</span> = <span class="variable">$create_reward</span>-><span class="title function_ invoke__">random_red</span>(<span class="variable">$total</span>, <span class="variable">$num</span>, <span class="variable">$max</span>, <span class="variable">$min</span>);</span><br><span class="line"><span class="title function_ invoke__">sort</span>(<span class="variable">$reward_arr</span>);<span class="comment">//正序，最小的在前面</span></span><br><span class="line"><span class="variable">$sum</span> = <span class="number">0</span>;</span><br><span class="line"><span class="variable">$min_count</span> = <span class="number">0</span>;</span><br><span class="line"><span class="variable">$max_count</span> = <span class="number">0</span>;</span><br><span class="line"><span class="keyword">foreach</span>(<span class="variable">$reward_arr</span> <span class="keyword">as</span> <span class="variable">$i</span> => <span class="variable">$val</span>) {</span><br><span class="line">    <span class="keyword">if</span> (<span class="variable">$i</span><<span class="number">3</span>) {</span><br><span class="line">        <span class="keyword">echo</span> <span class="string">"<br />第"</span>.(<span class="variable">$i</span>+<span class="number">1</span>).<span class="string">"个红包，金额为："</span>.<span class="variable">$val</span>.<span class="string">"<br />"</span>;  </span><br><span class="line">    } </span><br><span class="line">    <span class="keyword">if</span> (<span class="variable">$val</span> == <span class="variable">$max</span>) {</span><br><span class="line">          <span class="variable">$max_count</span>++;</span><br><span class="line">    }</span><br><span class="line">    <span class="keyword">if</span> (<span class="variable">$val</span> < <span class="variable">$min</span>) {</span><br><span class="line">        <span class="variable">$min_count</span>++;</span><br><span class="line">    }</span><br><span class="line">    <span class="variable">$val</span> = <span class="variable">$val</span>*<span class="number">100</span>;</span><br><span class="line">    <span class="variable">$sum</span> += <span class="variable">$val</span>;</span><br><span class="line">}</span><br><span class="line"><span class="comment">//检测钱是否全部发完</span></span><br><span class="line"><span class="keyword">echo</span> <span class="string">'<hr>已生成红包总金额为：'</span>.(<span class="variable">$sum</span>/<span class="number">100</span>).<span class="string">';总个数为：'</span>.<span class="title function_ invoke__">count</span>(<span class="variable">$reward_arr</span>).<span class="string">'<hr>'</span>;</span><br><span class="line"><span class="comment">//检测有没有小于0的值</span></span><br><span class="line"><span class="keyword">echo</span> <span class="string">"<br />最大值:"</span>.(<span class="variable">$val</span>/<span class="number">100</span>).<span class="string">',共有'</span>.<span class="variable">$max_count</span>.<span class="string">'个最大值，共有'</span>.<span class="variable">$min_count</span>.<span class="string">'个值比最小值小'</span>;</span><br></pre></td></tr></table></figure><p>运行结果：</p><p></p><p><strong>2） 正态分布情况</strong></p><p>注意，出图的时候，红包的数量不要给的太大，不然页面渲染不出来，会崩 。</p><figure class="highlight php"><table><tr><td class="code"><pre><span class="line"><span class="variable">$reward_arr</span> = <span class="variable">$create_reward</span>-><span class="title function_ invoke__">random_red</span>(<span class="variable">$total</span>, <span class="variable">$num</span>, <span class="variable">$max</span>, <span class="variable">$min</span>);</span><br><span class="line"><span class="variable">$show</span> = <span class="keyword">array</span>();</span><br><span class="line"><span class="title function_ invoke__">rsort</span>(<span class="variable">$reward_arr</span>);</span><br><span class="line"><span class="comment">//为了更直观的显示正态分布效果,需要将数组重新排序</span></span><br><span class="line"><span class="keyword">foreach</span>(<span class="variable">$reward_arr</span> <span class="keyword">as</span> <span class="variable">$k</span>=><span class="variable">$value</span>)</span><br><span class="line">{</span><br><span class="line">    <span class="variable">$t</span>=<span class="variable">$k</span>%<span class="number">2</span>;</span><br><span class="line">    <span class="keyword">if</span>(!<span class="variable">$t</span>) <span class="variable">$show</span>[]=<span class="variable">$value</span>;;</span><br><span class="line">    <span class="keyword">else</span> <span class="title function_ invoke__">array_unshift</span>(<span class="variable">$show</span>,<span class="variable">$value</span>);</span><br><span class="line">}</span><br><span class="line"><span class="keyword">echo</span> <span class="string">"设定最大值为:"</span>.<span class="variable">$max</span>.<span class="string">',最小值为:'</span>.<span class="variable">$min</span>.<span class="string">'<hr />'</span>;</span><br><span class="line"><span class="keyword">echo</span> <span class="string">"<table style='font-size:12px;width:600px;border:1px solid #ccc;text-align:left;'><tr><td>红包金额</td><td>图示</td></tr>"</span>;</span><br><span class="line"><span class="keyword">foreach</span>(<span class="variable">$show</span> <span class="keyword">as</span> <span class="variable">$val</span>)</span><br><span class="line">{</span><br><span class="line">    <span class="comment">#线条长度计算</span></span><br><span class="line">    <span class="variable">$width</span>=<span class="title function_ invoke__">intval</span>(<span class="variable">$num</span>*<span class="variable">$val</span>*<span class="number">300</span>/<span class="variable">$total</span>);</span><br><span class="line">    <span class="keyword">echo</span> <span class="string">"<tr><td> <span class="subst">{$val}</span> </td><td width='500px;text-align:left;'><hr style='width:<span class="subst">{$width}</span>px;height:3px;border:none;border-top:3px double red;margin:0 auto 0 0px;'></td></tr>"</span>;</span><br><span class="line">}</span><br><span class="line"><span class="keyword">echo</span> <span class="string">"</table>"</span>;</span><br></pre></td></tr></table></figure><p>运行结果：</p><p></p><blockquote><p><strong>PS</strong>：有朋友问我生成的数据有没有通过数学方法来验证其是否符合标准正态分布，因为我的数学不好，这个还真没算过，只是看着觉得像，就当他是了。既然遇到了这个问题，就一定要解决嘛，所以我就用 php 内置函数算了一下，算出来的结果在数据量小的时候还是比较接近正态分布的，但是数据量大起来的时候就不能看了，我整不太明白这个，大家感兴趣的可以找一下原因哟。 php 的四个函数：stats_standard_deviation（标准差），stats_variance（方差）， stats_kurtosis（(峰度），stats_skew（偏度）。使用上面的函数需要安装 <a href="(http://pecl.php.net/package/stats">stats</a> 扩展。</p></blockquote><h1 id="总结"><a href="#总结" class="headerlink" title="总结"></a>总结</h1><p>到这里，红包就算是写完啦，不知道能不能涨 50 块工资，但应该能解决燃眉之急了。<br>哦对，还落下了这个源码，<a href="https://github.com/xxlufei/reward">打包下载</a> 。</p>
</article>
<article>
<h1>Robots协议的那些事</h1>
<p>2017-01-12T04:33:20.000Z</p>
<p>由于本站文章搜索引擎搜索机器人（以下简称：爬虫）爬取效果不是很理想，出现了导航链接大量被爬取，而文章链接爬取较少。所以准备对本站加入 SEO，其实也就是引入了 <a href="http://baike.baidu.com/link?url=2cB03FvdeTNWMUFlQEQxT4E6FxQ7DGXQr7Q6tAt702pNePMjVODT4Sj1vxp9W5ehdG9QP6dUZBrsiIJNYphnkPz6M9D8nHmbo7sdLNEydcg7QVqgnu4LUIGKTg5v-3ii0JqcHLrvxcBzN1UNBBH3fWBWmVlh3Jh0kSpoybswT7_">Robots协议</a> 。Robots 协议（也称为爬虫协议、机器人协议等）的全称是「<a href="http://baike.baidu.com/link?url=qZmXuLBjgnHeD9Q-gV4Rg1QAZOF04_MbuFOQRLaA_jZqIBgqVkbtVA-8YAzHo3mFwtrL2l0vrfmgw97OlU2R36hMv0KGgRTFOnl2lonhJ7J4Uspy3WCTiGCtpGK65BCc">网络爬虫排除标准</a>」（Robots Exclusion Protocol）。网站通过 Robots 协议告诉搜索引擎哪些页面可以抓取，哪些页面不能抓取，而 <strong>robots.txt 文本文件</strong> 就是 Robots 协议的表述。</p><p><span id="more"></span></p><p>Robots 协议代表了互联网领域的一种契约精神，互联网企业只有遵守这一规则，才能保证网站及用户的隐私数据不被侵犯，违背 Robots 协议将带来巨大安全隐忧。例如，<a href="http://tech.ifeng.com/internet/special/baidupk360/content-1/detail_2012_08/29/17183239_0.shtml">百度诉奇虎360违反“Robots协议”抓取、复制其网站内容侵权一案</a>。</p><h1 id="爬取过程"><a href="#爬取过程" class="headerlink" title="爬取过程"></a>爬取过程</h1><p>互联网的网页都是通过超链接互相关联的，进而形成了网页的网状结构。所以爬虫的工作方法就如蜘蛛在网络上沿着超链接按照一定的爬取规则爬取网页。</p><p></p><p>基本流程大致为：</p><p>1） 喂给爬虫一堆 URL，称之为 <strong>种子</strong>（Seeds）；<br>2） 爬虫爬取 Seeds，<strong>分析</strong> HTML 网页，抽取其中的 <strong>超链接</strong>；<br>3） 爬虫接着爬取这些 <strong>新发现</strong> 的超链接指向的 HTML 网页；<br>4） 对过程 2），3）<strong>循环往复</strong>；</p><h1 id="协议作用"><a href="#协议作用" class="headerlink" title="协议作用"></a>协议作用</h1><p>Robots协议 <strong>主要功能</strong> 为以下 4 项：</p><p>1） 网站通过该协议告诉搜索引擎哪些页面可以抓取，哪些页面不能；<br>2） 可以屏蔽一些网站中比较大的文件，如：图片，音乐，视频等，节省服务器带宽；<br>3） 可以屏蔽站点的一些死链接，方便搜索引擎抓取网站内容；<br>4） 设置网站地图导向，方便引导蜘蛛爬取页面；</p><p>可以想象，如果一个站点没有引入 Robots 协议，那么爬虫就会漫无目地爬取，爬取结果一般不尽人意。反之，将我们站点内容通过 Robots 协议表述出来并引入 Robots 协议，爬虫就会按照我们的意愿进行爬取。</p><h1 id="协议原则"><a href="#协议原则" class="headerlink" title="协议原则"></a>协议原则</h1><p>Robots 协议是国际互联网界通行的 <strong>道德规范</strong>，基于以下 ** 原则** 建立：</p><p>1） 搜索技术应服务于人类，同时尊重信息提供者的意愿，并维护其隐私权；<br>2） 网站有义务保护其使用者的个人信息和隐私不被侵犯；</p><h1 id="协议表述"><a href="#协议表述" class="headerlink" title="协议表述"></a>协议表述</h1><p>Robots 协议是通过 robots.txt 文件来进行表述的，<a href="http://www.robotstxt.org/robotstxt.html">robots.txt文件规范见这里</a> 。robots.txt 文件是一个 <strong>文本文件</strong>，使用任何一个常见的文本编辑器都可以对它进行查看与编辑。当然，也可以使用 <a href="http://tool.chinaz.com/robots">Robots 文件生成工具</a> 方便地生成我们所需要的 robots.txt 文件。</p><p>提示： robots.txt 文件应该放置在网站根目录下。</p><h2 id="协议表述规范"><a href="#协议表述规范" class="headerlink" title="协议表述规范"></a>协议表述规范</h2><p>对规范大致描述为：</p><figure class="highlight ini"><table><tr><td class="code"><pre><span class="line">User-agent: *                           <span class="comment"># *代表所有的搜索引擎种类，是一个通配符，其他常用值：百度-Baiduspider，搜狗-sogou spider，谷歌-Googlebot</span></span><br><span class="line">Disallow: /admin/                       <span class="comment"># 禁止抓取admin目录下面的目录</span></span><br><span class="line">Disallow: /require/                     <span class="comment"># 禁止抓取require目录下面的目录</span></span><br><span class="line">Disallow: /static/                      <span class="comment"># 禁止抓取static目录下面的目录</span></span><br><span class="line">Disallow: /cgi-bin/*.htm                <span class="comment"># 禁止抓取/cgi-bin/目录下的所有以".htm"为后缀的URL(包含子目录)。</span></span><br><span class="line">Disallow: /*?*                          <span class="comment"># 禁止抓取网站中所有包含问号 (?) 的网址</span></span><br><span class="line">Disallow: /.jpg$                        <span class="comment"># 禁止抓取网站中所有的.jpg格式的图片</span></span><br><span class="line">Disallow: /public/404.html              <span class="comment"># 禁止爬取public文件夹下面的404.htm文件。</span></span><br><span class="line">Allow: /home/　                         <span class="comment"># 允许抓取home目录下面的目录</span></span><br><span class="line">Allow: /home                            <span class="comment"># 允许抓取home的整个目录</span></span><br><span class="line">Allow: .htm$                            <span class="comment"># 允许抓取以".htm"为后缀的URL。</span></span><br><span class="line">Allow: .gif$                            <span class="comment"># 允许抓取gif格式图片</span></span><br><span class="line">Sitemap: http://你的网址/map.xml          <span class="comment"># 建议加入xml格式的文件,这个是谷歌标准格式</span></span><br><span class="line">Sitemap: http://你的网址/map.html         <span class="comment"># 建议加入html格式的文件,这个是百度标准格式</span></span><br></pre></td></tr></table></figure><p>一般情况下不需要指定 Allow 这项配置。</p><h2 id="网站地图规范"><a href="#网站地图规范" class="headerlink" title="网站地图规范"></a>网站地图规范</h2><ul><li><strong>XML格式</strong></li></ul><p>这里参照了百度站长的 <a href="http://zhanzhang.baidu.com/college/courseinfo?id=267&page=2#h2_article_title3">官方文档</a>，大致描述如下：</p><figure class="highlight php"><table><tr><td class="code"><pre><span class="line"><span class="meta"><?</span>xml version=<span class="string">"1.0"</span> encoding=<span class="string">"utf-8"</span><span class="meta">?></span></span><br><span class="line"><!-- XML文件需以utf-<span class="number">8</span>编码--></span><br><span class="line"><urlset xmlns=<span class="string">"http://www.sitemaps.org/schemas/sitemap/0.9"</span>></span><br><span class="line"><!--必填标签--></span><br><span class="line">    <url></span><br><span class="line">        <!--必填标签,这是具体某一个链接的定义入口，每一条数据都要用<url>和</url>包含在里面，这是必须的 --></span><br><span class="line">        <loc>http:<span class="comment">//www.yoursite.com/yoursite.html</loc></span></span><br><span class="line">        <!--必填,URL链接地址,长度不得超过<span class="number">256</span>字节--></span><br><span class="line">        <lastmod><span class="number">2009</span>-<span class="number">12</span>-<span class="number">14</span></lastmod></span><br><span class="line">        <!--可以不提交该标签,用来指定该链接的最后更新时间--></span><br><span class="line">        <changefreq>daily</changefreq></span><br><span class="line">        <!--可以不提交该标签,用这个标签告诉此链接可能会出现的更新频率 --></span><br><span class="line">        <priority><span class="number">0.8</span></priority></span><br><span class="line">        <!--可以不提交该标签,用来指定此链接相对于其他链接的优先权比值，此值定于<span class="number">0.0</span>-<span class="number">1.0</span>之间--></span><br><span class="line">    </url></span><br><span class="line"></urlset></span><br></pre></td></tr></table></figure><ul><li><strong>HTML格式</strong></li></ul><p>主体结构为完整的 HTML，将需要被爬的链接以<code><a></></code>标签的形式加入到<code>body</code>中即可。</p><figure class="highlight html"><table><tr><td class="code"><pre><span class="line">... ...</span><br><span class="line"><span class="tag"><<span class="name">body</span>></span></span><br><span class="line">    <span class="tag"><<span class="name">a</span> <span class="attr">href</span>=<span class="string">"https://www.fanhaobai.com"</span> <span class="attr">title</span>=<span class="string">"首页"</span>></span></span><br><span class="line">    <span class="tag"><<span class="name">a</span> <span class="attr">href</span>=<span class="string">"https://www.fanhaobai.com/xxx/robots.html"</span> <span class="attr">title</span>=<span class="string">"Robots协议的那些事"</span>></span></span><br><span class="line">    ... ...</span><br><span class="line"><span class="tag"></<span class="name">body</span>></span></span><br><span class="line">... ...</span><br></pre></td></tr></table></figure><h2 id="本站配置"><a href="#本站配置" class="headerlink" title="本站配置"></a>本站配置</h2><ul><li>** 本站博客 **</li></ul><p>本站拒绝了雅虎爬虫的爬取，对其他的爬虫，theme、static 目录下的 2 个逻辑代码目录 api、module 和 4 个静态资源目录 font、css、img、js 做了限制爬取，对 static 目录下 upload 做了允许爬取处理，并配置了后缀为<code>.xml</code>和<code>.htm</code>文件的站点地图。</p><figure class="highlight ini"><table><tr><td class="code"><pre><span class="line"><span class="comment"># robots.txt for fanhaobai.com 2017.01.12</span></span><br><span class="line"><span class="comment"># yahoo disallow</span></span><br><span class="line">User-agent: Slurp</span><br><span class="line">Disallow: /</span><br><span class="line"><span class="comment"># other allow</span></span><br><span class="line">User-agent: *</span><br><span class="line">Disallow: /admin</span><br><span class="line">Disallow: /theme/</span><br><span class="line">Disallow: /static/api/</span><br><span class="line">Disallow: /static/module/</span><br><span class="line">Disallow: /static/font/</span><br><span class="line">Disallow: /static/css/</span><br><span class="line">Disallow: /static/img/</span><br><span class="line">Disallow: /static/js/</span><br><span class="line">Sitemap: http://www.fanhaobai.com/map.xml</span><br><span class="line">Sitemap: http://www.fanhaobai.com/map.html</span><br></pre></td></tr></table></figure><p>查看本站的 <strong>网站地图</strong>，<a href="#">HTML格式</a> 和 <a href="https://www.fanhaobai.com/sitemap.xml">XML格式</a> 。</p><ul><li>** 本站维基 **</li></ul><figure class="highlight ini"><table><tr><td class="code"><pre><span class="line">User-agent: *</span><br><span class="line">Disallow: /</span><br></pre></td></tr></table></figure><h1 id="提交文件"><a href="#提交文件" class="headerlink" title="提交文件"></a>提交文件</h1><p>一般情况下，站点根目录下加入了 robots.txt 文件后，各种搜索引擎的爬虫就会自动爬取该文件。尽管如此，还是建议手动将 robots.txt 文件提交到搜索引擎，同时也能帮助检测 robots.txt 文件是否存在错误。</p><p>本站手动将 robots.txt 提交到谷歌和百度两个搜索引擎：</p><p>1） <a href="https://www.google.com/webmasters/tools/robots-testing-tool?hl=zh-CN">谷歌测试工具</a></p><p></p><p>2） <a href="http://zhanzhang.baidu.com/robots/index">百度测试工具</a></p><p></p><p>按照对应提示操作即可，出现上图情况则表示 robots.txt 手动提交成功。</p><h1 id="总结"><a href="#总结" class="headerlink" title="总结"></a>总结</h1><p>Robots 协议只是爬虫抓取站点内容的一种规则，需要搜索引擎爬虫的配合才行，并不是每个搜索引擎爬虫都遵守的。但是，目前看来，绝大多数的搜索引擎爬虫都遵守 Robots 协议的规则。</p><p>值得注意的是，robots.txt 文件虽说是提供给爬虫使用，但是正如它的名称——网络爬虫排除标准，它具有消极的排爬虫抓取作用。所以百度官方建议，** <a href="#">仅当网站包含不希望被搜索引擎收录的内容时，才需要使用 robots.txt 文件。如果您希望搜索引擎收录网站上所有内容，请勿建立robots.txt 文件</a> **。</p><blockquote><p>推荐一篇相关文章：<a href="http://lusongsong.com/reed/732.html%E3%80%82">http://lusongsong.com/reed/732.html。</a></p></blockquote><p><strong>相关文章 <a href="#">»</a></strong></p><ul><li><a href="https://www.fanhaobai.com/2017/01/push-links.html">如何向搜索引擎提交链接</a> <span>（2017-01-17）</span></li></ul>
</article>
<article>
<h1>我是一个线程（修订版）</h1>
<p>2016-10-11T15:01:00.000Z</p>
<blockquote><p>转自「<a href="http://mp.weixin.qq.com/s?__biz=MzAxOTc0NzExNg==&mid=416915373&idx=1&sn=f80a13b099237534a3ef777d511d831a&scene=0#wechat_redirect&utm_source=tuicool&utm_medium=referral">码农翻身</a>」</p></blockquote><p>我是一个 <a href="#">线程</a>，我一出生就被编了个号：0x3704。</p><p><span id="more"></span></p><h1 id="第一回-初生牛犊"><a href="#第一回-初生牛犊" class="headerlink" title="第一回 初生牛犊"></a>第一回 初生牛犊</h1><p>我出生后被领到一个昏暗的屋子里，在这里我发现了很多和我一模一样的同伴。我身边的同伴 0x6900 待的时间比较长，他带着沧桑的口气对我说：“我们线程的宿命就是处理包裹。把包裹处理完以后还得马上回到这里，否则可能永远回不来了。”</p><p>我一脸懵懂，“包裹，什么包裹？”</p><p>“不要着急，马上你就会明白了，我们这里是不养闲人的。”</p><p>果然，没多久，屋子的门开了， 一个面貌凶恶的家伙吼道：“0x3704，出来！”</p><p>我一出来就被塞了一个沉甸甸的包裹，上面还附带着一个写满了操作步骤的纸。 </p><p>“快去，把这个包裹处理了。”</p><p>“去哪儿处理？”</p><p>“跟着指示走，先到就绪车间。”</p><p>果然，地上有指示箭头，跟着它来到了一间明亮的大屋子，这里已经有不少线程了，大家都很紧张，好像时刻准备着往前冲。</p><p>我刚一进来，就听见广播说：“0x3704，进入车间。”</p><p>我赶紧往前走，身后有很多人议论。</p><p>“他太幸运了，刚进入就绪状态就能运行。”</p><p>“是不是有关系？”</p><p>“不是，你看人家的优先级多高啊，唉！”</p><p>前边就是车间，这里简直是太美了，怪不得老线程总是唠叨着说：“要是能一直待在这里就好了。”</p><p>这里空间大，视野好，空气清新，鸟语花香，还有很多从来没见过的人，像服务员一样等着为我服务。</p><p>他们也都有编号，更重要的是每个人还有个标签，上面写着：硬盘、数据库、内存、网卡……</p><p>我现在理解不了，看看操作步骤吧。</p><p>1） 第一步：从包裹中取出参数</p><p>打开包裹，里边有个<code>HttpRequest</code>对象，可以取到<code>userName</code>、 <code>password</code>两个参数。</p><p>2） 第二步：执行登录操作</p><p>奥，原来是有人要登录啊，我把<code>userName</code>、<code>password</code>交给数据库服务员，他拿着数据，慢腾腾地走了。</p><p>他怎么这么慢？不过我是不是正好可以在车间里多待一会儿？反正也没法执行第三步。</p><p>就在这时，车间里的广播响了：“0x3704，我是 <a href="#">CPU</a>，记住你正在执行的步骤，然后马上带着包裹离开！”</p><p>我慢腾腾地开始收拾。</p><p>“快点，别的线程马上就要进来了。”</p><p>离开这个车间，又来到一个大屋子，这里有很多线程在慢腾腾地喝茶，打牌。</p><p>“哥们，你们没事干了？”</p><p>“你新来的吧，你不知道我在等数据库服务员给我数据啊！据说他们比我们慢好几十万倍，在这里好好歇吧。”</p><p>“啊？ 这么慢！我这里有人在登录系统，能等这么长时间吗？”</p><p>“放心，你没听说过人间一天，CPU 一年吗？我们这里是用纳秒、毫秒计时的，人间等待一秒，相当于我们好几天呢，来得及。”</p><p>干脆睡一会吧。不知道过了多久，大喇叭又开始广播了：“0x3704，你的数据来了，快去执行！”</p><p>我转身就往 CPU 车间跑，发现这里的门只出不进！</p><p>后面传来阵阵哄笑声：“果然是新人，不知道还得去就绪车间等。”</p><p>于是赶紧到就绪车间，这次没有那么好运了，等了好久才被再次叫进 CPU 车间。</p><p>在等待的时候，我听见有人小声议论：</p><p>“听说了吗，最近有个线程被 kill 掉了。”</p><p>“为啥啊？”</p><p>“这家伙赖在 CPU 车间不走，把 CPU 利用率一直搞成 100% ，后来就被 kill 掉了。”</p><p>“Kill 掉以后弄哪儿去了？”</p><p>“可能被垃圾回收了吧。”</p><p>我心里打了个寒噤，赶紧接着处理，剩下的动作快多了，第二步登录成功。</p><p>3） 第三步：构建登录成功后的主页</p><p>这一步有点费时，因为有很多<code>HTML</code>需要处理，不知道代码谁写的，处理起来很烦人。</p><p>我正在紧张的制作<code>HTML</code>呢，CPU 又开始叫了：</p><p>“0x3704，我是 CPU ，记住你正在执行的步骤，然后马上带着包裹离开！”</p><p>“为啥啊？”</p><p>“每个线程只能在 CPU 上运行一段时间，到了时间就得让别人用了，你去就绪车间待着，等着叫你吧。”</p><p>就这样，我一直在“就绪——运行”这两个状态中不知道轮转了多少次， 终于按照步骤清单把工作做完了。</p><p>最后顺利地把包含<code>HTML</code>的包裹发了回去。至于登录以后干什么事儿，我就不管了。马上就要回到我那昏暗的房间了，真有点舍不得这里。不过相对于有些线程，我还是幸运的，他们运行完以后就被彻底地销毁了，而我还活着！</p><p>回到了小黑屋，老线程 0x6900 问：</p><p>“怎么样？第一天有什么感觉？”</p><p>“我们的世界规则很复杂，首先你不知道什么时候会被挑中执行；第二，在执行的过程中随时可能被打断，让出 CPU 车间；第三，一旦出现硬盘、数据库这样耗时的操作，也得让出 CPU 去等待；第四，就是数据来了，你也不一定马上执行，还得等着 CPU 挑选。”</p><p>“小伙子理解的不错啊。”</p><p>“我不明白为什么很多线程执行完任务就死了，为什么咱们还活着？”</p><p>“你还不知道？长生不老是我们的特权！我们这里有个正式的名称，叫作线程池！”</p><h1 id="第二回-渐入佳境"><a href="#第二回-渐入佳境" class="headerlink" title="第二回 渐入佳境"></a>第二回 渐入佳境</h1><p>平淡的日子就这么一天天地过去，作为一个线程，我每天的生活都是取包裹、处理包裹，然后回到我们昏暗的家：<a href="#">线程池</a> 。</p><p>有一天我回来的时候，听到有个兄弟说，今天要好好休息下，明天就是最疯狂的一天。我看了一眼日历，明天是 11 月 11 号。 </p><p>果然，零点刚过，不知道那些人类怎么了，疯狂地投递包裹，为了应付蜂拥而至的海量包裹，线程池里没有一个人能闲下来，全部出去处理包裹，CPU 车间利用率超高，硬盘在嗡嗡转，网卡疯狂的闪，即便如此，还是处理不完，堆积如山。</p><p>我们也没有办法，实在是太多太多了，这些包裹中大部分都是浏览页面，下订单，买、买、买。</p><p>不知道过了多久，包裹山终于慢慢地消失了。终于能够喘口气，我想我永远都不会忘记这一天。</p><p>通过这个事件，我明白了我所处的世界：这是一个电子商务的网站！</p><p>我每天的工作就是处理用户的登录，浏览，购物车，下单，付款。</p><p>我问线程池的元老 0x6900：“我们要工作到什么时候？”</p><p>“要一直等到系统重启的那一刻。”0x6900 说。</p><p>“那你经历过系统重启吗？”</p><p>“怎么可能？系统重启就是我们的死亡时刻，也就是世界末日，一旦重启，整个线程池全部销毁，时间和空间全部消失，一切从头再来。”</p><p>“那什么时候会重启？”</p><p>“这就不好说了，好好享受眼前的生活吧……”</p><p>其实生活还是丰富多彩的，我最喜欢的包裹是上传图片，由于网络慢，所以能在就绪车间、CPU 车间待很长很长时间，可以认识很多好玩的线程。</p><p>比如说上次认识了 memecached 线程，他对我说在他的帮助下缓存了很多的用户数据，还是分布式的！很多机器上都有！</p><p>我问他：“怪不得后来的登录操作快了那么多，原来是不再从数据库取数据了你那里就有啊，哎对了你是分布式的你去过别的机器没有？”</p><p>他说：“怎么可能！我每次也只能通过网络往那个机器发送一个<code>GET</code>、<code>PUT</code>命令才存取数据而已，别的一概不知。”</p><p>再比如说上次在等待的时候遇到了数据库连接的线程，我才知道他那里也是一个连接池，和我们的线程池几乎一模一样。</p><p>他告诉我：“有些包裹太变态了，竟然查看一年的订单数据，简直把我累死了。”</p><p>我说：“拉倒吧你，你那是纯数据，你把数据传给我以后，我还得组装成<code>HTML</code>，工作量不知道比你大多少倍。”</p><p>他建议我：“你一定要和 memecached 搞好关系，直接从他那儿拿数据，尽量少直接调用数据库，这样我们<code>JDBC connection</code>也能活得轻松点。”</p><p>我欣然接纳：“好啊好啊，关键是你得提前把数据搞到缓存啊，要不然我先问一遍缓存，没有数据，我这不还得找你吗？”</p><p>生活就是这样，如果你自己不找点乐子，还有什么意思？</p><h1 id="第三回-虎口脱险"><a href="#第三回-虎口脱险" class="headerlink" title="第三回 虎口脱险"></a>第三回 虎口脱险</h1><p>前几天我遇到一个可怕的事情，差一点死在外边，回不了线程池了。其实这次遇险我应该能够预想得到才对，真是太大意了。</p><p>那天我处理了一些从<code>http</code>发来的存款和取款的包裹，老线程 0x6900 特意嘱咐我：“处理这些包裹的时候一定要特别小心，你必须先获得一把锁，在对账户存款或取款的时候一定要把账户锁住，要不然别的线程就会在你等待的时候趁虚而入，搞破坏，我年轻那会儿很毛糙，就捅了篓子。”</p><p>为了“恐吓”我， 好心的 0x6900 还给了我两个表格：</p><p>1） 没有加锁的情况</p><p>一个银行账号：账户 A，余额 1000 元<br>一个存钱的线程<br>一个取款的线程</p><table><thead><tr><th>线程1：存入300元</th><th>线程2：取出200元</th></tr></thead><tbody><tr><td>获得当前余额：1000</td><td></td></tr><tr><td>计算最新余额：1000+300=1300</td><td></td></tr><tr><td>线程中断，等待下次被系统执行</td><td>获取当前余额：1000</td></tr><tr><td></td><td>计算最新余额：1000-200=800</td></tr><tr><td></td><td>线程中断，等待下次被系统执行</td></tr><tr><td>再次执行，更新余额1300</td><td></td></tr><tr><td></td><td>再次执行，更新余额：<strong>800</strong><br><strong>存入的钱丢了</strong></td></tr></tbody></table><p>2） 加锁的情况</p><table><thead><tr><th>线程1：存入300元</th><th>线程2：取出200元</th></tr></thead><tbody><tr><td>获取账号A的锁：成功</td><td></td></tr><tr><td>获取余额：1000</td><td></td></tr><tr><td>计算最新余额：1000+300=1300</td><td></td></tr><tr><td>线程中断，等待下次被系统执行</td><td></td></tr><tr><td></td><td>获取账户A的锁：失败，进入阻塞状态</td></tr><tr><td>被系统选中，再次执行，更新余额1300</td><td></td></tr><tr><td>释放账户A的锁</td><td></td></tr><tr><td></td><td>获取账户A的锁：成功</td></tr><tr><td></td><td>获取余额：1300</td></tr><tr><td></td><td>计算最新余额：1300-200=1100</td></tr><tr><td></td><td>更新余额：1100</td></tr><tr><td></td><td>释放锁账户A的锁</td></tr></tbody></table><p>我看得胆颤心惊，原来不加锁会带来这么严重的事故。从此以后看到存款、取款的包裹就倍加小心，还好没有出过事故。</p><p>今天我收到的一个包裹是转账，从某著名演员的账户给某著名导演的账户转钱，具体是谁我就不透漏了，数额可真是不小。</p><p>我按照老线程的吩咐，肯定要加锁啊，先对著名演员的账户加锁，再对著名导演的账户加锁。</p><p>可我万万没想到的是，还有一个线程，对，就是 0x7954，竟然同时在从这个导演的账户往这个演员的账户转账。 </p><p>于是乎，就出现了这么个情况：</p><table><thead><tr><th>线程0x3704：著名演员->著名导演</th><th>线程0x7954：著名导演->著名演员</th></tr></thead><tbody><tr><td>获取著名演员的锁：成功</td><td></td></tr><tr><td>线程中断，等待下次被系统执行</td><td></td></tr><tr><td></td><td>获取著名导演的锁：成功</td></tr><tr><td></td><td>线程中断，等待下次被系统执行</td></tr><tr><td>获取著名导演的锁：失败，继续等待</td><td></td></tr><tr><td></td><td>获取著名演员的锁：失败，继续等待</td></tr></tbody></table><p>刚开始我还不知道什么情况，一直坐在等待车间傻等，可是等的时间太长了，长达几十秒！我可从来没有经历过这样的事件。</p><p>这时候我就看到了线程 0x7954，他悠闲地坐在那里喝咖啡，我和他聊了起来：</p><p>“哥们，我看你已经喝了 8 杯咖啡了，怎么还不去干活？”</p><p>“你不喝了 9 杯茶了吗？”0x7954 回敬道。</p><p>“我在等一个锁，不知道哪个孙子一直不释放！”</p><p>“我也在等锁啊，我要是知道哪个孙子不释放锁我非揍死他不可！”0x7954 毫不示弱。</p><p>我偷偷地看了一眼，这家伙怀里不就抱着我正等的某导演的锁吗？</p><p>很明显，0x7954 也发现了我正抱着他正在等待的锁。</p><p>很快我们两个就吵了起来，互不相让：</p><p>“把你的锁先给我，让我先做完！”</p><p>“不行，从来都是做完工作才释放锁，现在绝对不能给你！”</p><p>从争吵到打起来，就那么几秒钟的事儿。更重要的是，我们俩不仅仅持有这个著名导演和演员的锁，还有很多其他的锁，导致等待的线程越来越多，围观的人们把屋子都挤满了。最后事情真的闹大了，我从来没见过的终极大 Boss “操作系统”也来了。大 Boss 毕竟见多识广，他看了一眼，哼了一声，很不屑地说：</p><p>“又出现死锁了。”</p><p>“你们俩要 kill 掉一个，来吧，过来抽签。”</p><p>这一下子把我给吓尿了，这么严重啊！我战战兢兢地抽了签，打开一看，是个“活”字。唉，小命终于保住了。</p><p>可怜的 0x7954 被迫交出了所有的资源以后，很不幸地被 kill 掉，消失了。我拿到了导演的锁，可以开始干活了。大 Boss “操作系统”如一阵风似的消失了，身后只传来他的声音：</p><p>“记住，我们这里导演>演员，无论任何情况都要先获得导演的锁。”</p><p>由于这里不仅仅只有导演和演员，还有很多其他人，大 Boss 留下了一个表格， 里边是个算法，用来计算资源的大小，计算出来以后，永远按照从大到小的方式来获得锁： </p><table><thead><tr><th>线程1：账户A转到账户B</th><th>线程2：账户B转到账户A</th></tr></thead><tbody><tr><td>获取账户A的锁：成功</td><td></td></tr><tr><td>线程中断，等待下次被系统执行</td><td></td></tr><tr><td></td><td>获取账户A的锁：失败，继续等待</td></tr><tr><td>获取账户B的锁：成功</td><td></td></tr><tr><td>执行转账</td><td></td></tr><tr><td>释放B的锁</td><td></td></tr><tr><td>释放A的锁</td><td></td></tr><tr><td></td><td>获取账户A的锁：成功</td></tr><tr><td></td><td>获取账户B的锁：成功</td></tr><tr><td></td><td>执行转账</td></tr><tr><td></td><td>释放B的锁</td></tr><tr><td></td><td>释放A的锁</td></tr></tbody></table><p>我回到线程池，大家都知道了我的历险，围着我问个不停。</p><p>凶神恶煞的线程调度员把大 Boss 的算法贴到了墙上。</p><p>每天早上，我们都得像无节操的房屋中介、美容美发店的服务员一样，站在门口，像被耍猴一样大声背诵：</p><p>“多个资源加锁要牢记，一定要按 Boss 的算法比大小，然后从最大的开始加锁。”</p><h1 id="第四回-江湖再见"><a href="#第四回-江湖再见" class="headerlink" title="第四回 江湖再见"></a>第四回 江湖再见</h1><p>又过了很多天，我和其他线程们发现了一个奇怪的事情：包裹的处理越来越简单，不管任何包裹，不管是登录、浏览、存钱……处理的步骤都是一样的, 返回一个固定的<code>HTML</code>页面。</p><p>有一次我偷偷地看了一眼，上面写着：“本系统将于今晚 00:00 至 4:00 进行维护升级， 给您带来的不便我们深感抱歉！”</p><p>我去告诉了老线程 0x6904，他叹了一口气说：</p><p>“唉，我们的生命也到头了，看来马上就要重启系统，我们就要消失了，再见吧兄弟。”</p><p>系统重启的那一刻终于到来了。我看到屋子里的东西一个个的不见了，等待车间、就绪车间，甚至 CPU 车间都慢慢地消失了。我身边的线程兄弟也越来越少，最后只剩我自己了。</p><p>我在空旷的原野上大喊：“还有人吗？”</p><p>无人应答。</p><p>我们这一代线程池完成了使命……</p><p>不过下一代线程池即将重生！</p>
</article>
<article>
<h1>MySQL索引背后的数据结构及算法原理</h1>
<p>2016-05-18T16:00:00.000Z</p>
<blockquote><p>原文：<a href="http://blog.codinglabs.org/articles/theory-of-mysql-index.html">http://blog.codinglabs.org/articles/theory-of-mysql-index.html</a></p></blockquote><p>本文以 MySQL 数据库为研究对象，讨论与数据库索引相关的一些话题。特别需要说明的是， MySQL 支持诸多存储引擎，而各种存储引擎对索引的支持也各不相同，因此 MySQL 数据库支持多种索引类型，如 BTree 索引，哈希索引，全文索引等等。为了避免混乱，本文将只关注于 BTree 索引，因为这是平常使用 MySQL 时主要打交道的索引，至于哈希索引和全文索引本文暂不讨论。<br><span id="more"></span></p><p>文章主要内容分为三个部分。</p><ul><li>第一部分主要从数据结构及算法理论层面讨论 MySQL 数据库索引的数理基础。</li><li>第二部分结合 MySQL 数据库中 MyISAM 和 InnoDB 数据存储引擎中索引的架构实现讨论聚集索引、非聚集索引及覆盖索引等话题。</li><li>第三部分根据上面的理论基础，讨论 MySQL 中高性能使用索引的策略。</li></ul><h1 id="数据结构及算法基础"><a href="#数据结构及算法基础" class="headerlink" title="数据结构及算法基础"></a>数据结构及算法基础</h1><h2 id="索引的本质"><a href="#索引的本质" class="headerlink" title="索引的本质"></a>索引的本质</h2><p>MySQL 官方对索引的定义为：索引（Index）是帮助 MySQL 高效获取数据的数据结构。提取句子主干，就可以得到索引的本质：索引是数据结构。</p><p>我们知道，数据库查询是数据库的最主要功能之一。我们都希望查询数据的速度能尽可能的快，因此数据库系统的设计者会从查询算法的角度进行优化。最基本的查询算法当然是 <a href="http://en.wikipedia.org/wiki/Linear_search">顺序查找</a>（linear search），这种复杂度为 O(n) 的算法在数据量很大时显然是糟糕的，好在计算机科学的发展提供了很多更优秀的查找算法，例如 <a href="http://en.wikipedia.org/wiki/Binary_search_algorithm">二分查找</a>（binary search）、<a href="http://en.wikipedia.org/wiki/Binary_search_tree">二叉树查找</a>（binary tree search）等。如果稍微分析一下会发现，每种查找算法都只能应用于特定的数据结构之上，例如二分查找要求被检索数据有序，而二叉树查找只能应用于 <a href="http://en.wikipedia.org/wiki/Binary_search_tree">二叉查找树</a> 上，但是数据本身的组织结构不可能完全满足各种数据结构（例如，理论上不可能同时将两列都按顺序进行组织），所以，在数据之外，数据库系统还维护着满足特定查找算法的数据结构，这些数据结构以某种方式引用（指向）数据，这样就可以在这些数据结构上实现高级查找算法。这种数据结构，就是索引。</p><p>看一个例子：</p><p></p><p>图 1 展示了一种可能的索引方式。左边是数据表，一共有两列七条记录，最左边的是数据记录的物理地址（注意逻辑上相邻的记录在磁盘上也并不是一定物理相邻的）。为了加快 Col2 的查找，可以维护一个右边所示的二叉查找树，每个节点分别包含索引键值和一个指向对应数据记录物理地址的指针，这样就可以运用二叉查找在$O \left (  \log_{2} n  \right )$ 的复杂度内获取到相应数据。</p><p>虽然这是一个货真价实的索引，但是实际的数据库系统几乎没有使用二叉查找树或其进化品种 <a href="http://en.wikipedia.org/wiki/Red-black_tree">红黑树</a>（red-black tree）实现的，原因会在下文介绍。</p><h2 id="B-Tree和B-Tree"><a href="#B-Tree和B-Tree" class="headerlink" title="B-Tree和B+Tree"></a>B-Tree和B+Tree</h2><p>目前大部分数据库系统及文件系统都采用 B-Tree 或其变种 B+Tree 作为索引结构，在本文的下一节会结合存储器原理及计算机存取原理讨论为什么 B-Tree 和 B+Tree 在被如此广泛用于索引，这一节先单纯从数据结构角度描述它们。</p><h3 id="B-Tree"><a href="#B-Tree" class="headerlink" title="B-Tree"></a>B-Tree</h3><p>为了描述 B-Tree，首先定义一条数据记录为一个二元组 [key, data]，key 为记录的键值，对于不同数据记录，key 是互不相同的，data 为数据记录除 key 外的数据。那么 B-Tree 是满足下列条件的数据结构：</p><ul><li>d 为大于 1 的一个正整数，称为 B-Tree 的度。</li><li>h 为一个正整数，称为 B-Tree 的高度。</li><li>每个非叶子节点由 n-1 个 key 和 n 个指针组成，其中 d<=n<=2d。</li><li>每个叶子节点最少包含一个 key 和两个指针，最多包含 2d-1 个 key 和 2d 个指针，叶节点的指针均为 null 。</li><li>所有叶节点具有相同的深度，等于树高 h。</li><li>key 和指针互相间隔，节点两端是指针。</li><li>一个节点中的 key 从左到右非递减排列。</li><li>所有节点组成树结构。</li><li>每个指针要么为 null，要么指向另外一个节点。</li><li>如果某个指针在节点 node 最左边且不为 null，则其指向节点的所有 key 小于 v(key1)，其中 v(key1) 为 node 的第一个 key 的值。</li><li>如果某个指针在节点 node 最右边且不为 null，则其指向节点的所有 key 大于 v(keym)，其中 v(keym) 为 node 的最后一个 key 的值。</li><li>如果某个指针在节点 node 的左右相邻 key 分别是 v(keyi) 和 v(keyi+1) 且不为 null，则其指向节点的所有 key 小于 v(keyi+1) 且大于 v(keyi)。</li></ul><p>图 2 是一个 d=2 的 B-Tree 示意图。</p><p></p><p>由于 B-Tree 的特性，在 B-Tree 中按 key 检索数据的算法非常直观：首先从根节点进行二分查找，如果找到则返回对应节点的 data，否则对相应区间的指针指向的节点递归进行查找，直到找到节点或找到 null 指针，前者查找成功，后者查找失败。B-Tree 上查找算法的伪代码如下：</p><figure class="highlight c++"><table><tr><td class="code"><pre><span class="line"><span class="built_in">BTree_Search</span>(node, key) {</span><br><span class="line">  <span class="keyword">if</span>(node == null) <span class="keyword">return</span> null;    </span><br><span class="line">  foreach(node.key) {        </span><br><span class="line">    <span class="keyword">if</span>(node.key[i] == key) <span class="keyword">return</span> node.data[i];            </span><br><span class="line">    <span class="keyword">if</span>(node.key[i] > key) <span class="keyword">return</span> <span class="built_in">BTree_Search</span>(point[i]->node);    </span><br><span class="line">  }    </span><br><span class="line">  <span class="keyword">return</span> <span class="built_in">BTree_Search</span>(point[i+<span class="number">1</span>]->node);</span><br><span class="line">}</span><br><span class="line">data = <span class="built_in">BTree_Search</span>(root, my_key);</span><br></pre></td></tr></table></figure><p>关于 B-Tree 有一系列有趣的性质，例如一个度为 d 的 B-Tree，设其索引 N 个 key，则其树高h的上限为 $\log_{d} \left ( \left ( N + 1 \right ) / 2 \right )$，检索一个 key，其查找节点个数的渐进复杂度为 $O \left (  \log_{d} N  \right )$。从这点可以看出，B-Tree 是一个非常有效率的索引数据结构。</p><p>另外，由于插入删除新的数据记录会破坏 B-Tree 的性质，因此在插入删除时，需要对树进行一个分裂、合并、转移等操作以保持 B-Tree 性质，本文不打算完整讨论 B-Tree 这些内容，因为已经有许多资料详细说明了 B-Tree 的数学性质及插入删除算法，有兴趣的朋友可以在本文末的参考文献一栏找到相应的资料进行阅读。</p><h3 id="B-Tree-1"><a href="#B-Tree-1" class="headerlink" title="B+Tree"></a>B+Tree</h3><p>B-Tree 有许多变种，其中最常见的是 B+Tree，例如 MySQL 就普遍使用 B+Tree 实现其索引结构。</p><p>与 B-Tree 相比，B+Tree 有以下不同点：</p><ul><li>每个节点的指针上限为 2d 而不是 2d+1。</li><li>内节点不存储 data，只存储 key，叶子节点不存储指针。</li></ul><p>图 3 是一个简单的 B+Tree 示意。</p><p></p><p>由于并不是所有节点都具有相同的域，因此 B+Tree 中叶节点和内节点一般大小不同。这点与 B-Tree 不同，虽然 B-Tree 中不同节点存放的 key 和指针可能数量不一致，但是每个节点的域和上限是一致的，所以在实现中 B-Tree 往往对每个节点申请同等大小的空间。</p><p>一般来说，B+Tree 比 B-Tree 更适合实现外存储索引结构，具体原因与外存储器原理及计算机存取原理有关，将在下面讨论。</p><h3 id="带有顺序访问指针的B-Tree"><a href="#带有顺序访问指针的B-Tree" class="headerlink" title="带有顺序访问指针的B+Tree"></a>带有顺序访问指针的B+Tree</h3><p>一般在数据库系统或文件系统中使用的 B+Tree 结构都在经典 B+Tree 的基础上进行了优化，增加了顺序访问指针。</p><p></p><p>如图 4 所示，在 B+Tree 的每个叶子节点增加一个指向相邻叶子节点的指针，就形成了带有顺序访问指针的 B+Tree。做这个优化的目的是为了提高区间访问的性能，例如图 4 中如果要查询 key 为从 18 到 49 的所有数据记录，当找到 18 后，只需顺着节点和指针顺序遍历就可以一次性访问到所有数据节点，极大提到了区间查询效率。</p><p>这一节对 B-Tree 和 B+Tree 进行了一个简单的介绍，下一节结合存储器存取原理介绍为什么目前  B+Tree 是数据库系统实现索引的首选数据结构。</p><h2 id="为什么使用B-Tree（B-Tree）"><a href="#为什么使用B-Tree（B-Tree）" class="headerlink" title="为什么使用B-Tree（B+Tree）"></a>为什么使用B-Tree（B+Tree）</h2><p>上文说过，红黑树等数据结构也可以用来实现索引，但是文件系统及数据库系统普遍采用 B-/+Tree  作为索引结构，这一节将结合计算机组成原理相关知识讨论 B-/+Tree 作为索引的理论基础。</p><p>一般来说，索引本身也很大，不可能全部存储在内存中，因此索引往往以索引文件的形式存储的磁盘上。这样的话，索引查找过程中就要产生磁盘 I/O 消耗，相对于内存存取，I/O 存取的消耗要高几个数量级，所以评价一个数据结构作为索引的优劣最重要的指标就是在查找过程中磁盘 I/O 操作次数的渐进复杂度。换句话说，索引的结构组织要尽量减少查找过程中磁盘 I/O 的存取次数。下面先介绍内存和磁盘存取原理，然后再结合这些原理分析 B-/+Tree 作为索引的效率。</p><h3 id="主存存取原理"><a href="#主存存取原理" class="headerlink" title="主存存取原理"></a>主存存取原理</h3><p>目前计算机使用的主存基本都是随机读写存储器（RAM），现代  RAM 的结构和存取原理比较复杂，这里本文抛却具体差别，抽象出一个十分简单的存取模型来说明 RAM 的工作原理。</p><p></p><p>从抽象角度看，主存是一系列的存储单元组成的矩阵，每个存储单元存储固定大小的数据。每个存储单元有唯一的地址，现代主存的编址规则比较复杂，这里将其简化成一个二维地址：通过一个行地址和一个列地址可以唯一定位到一个存储单元。图 5 展示了一个 4 x 4 的主存模型。</p><p>主存的存取过程如下：</p><p>当系统需要读取主存时，则将地址信号放到地址总线上传给主存，主存读到地址信号后，解析信号并定位到指定存储单元，然后将此存储单元数据放到数据总线上，供其它部件读取。</p><p>写主存的过程类似，系统将要写入单元地址和数据分别放在地址总线和数据总线上，主存读取两个总线的内容，做相应的写操作。</p><p>这里可以看出，主存存取的时间仅与存取次数呈线性关系，因为不存在机械操作，两次存取的数据的“距离”不会对时间有任何影响，例如，先取 A0 再取 A1 和先取 A0 再取 D3 的时间消耗是一样的。</p><h3 id="磁盘存取原理"><a href="#磁盘存取原理" class="headerlink" title="磁盘存取原理"></a>磁盘存取原理</h3><p>上文说过，索引一般以文件形式存储在磁盘上，索引检索需要磁盘 I/O 操作。与主存不同，磁盘 I/O 存在机械运动耗费，因此磁盘 I/O 的时间消耗是巨大的。</p><p>图 6 是磁盘的整体结构示意图。</p><p></p><p>一个磁盘由大小相同且同轴的圆形盘片组成，磁盘可以转动（各个磁盘必须同步转动）。在磁盘的一侧有磁头支架，磁头支架固定了一组磁头，每个磁头负责存取一个磁盘的内容。磁头不能转动，但是可以沿磁盘半径方向运动（实际是斜切向运动），每个磁头同一时刻也必须是同轴的，即从正上方向下看，所有磁头任何时候都是重叠的（不过目前已经有多磁头独立技术，可不受此限制）。</p><p>图 7 是磁盘结构的示意图。</p><p></p><p>盘片被划分成一系列同心环，圆心是盘片中心，每个同心环叫做一个磁道，所有半径相同的磁道组成一个柱面。磁道被沿半径线划分成一个个小的段，每个段叫做一个扇区，每个扇区是磁盘的最小存储单元。为了简单起见，我们下面假设磁盘只有一个盘片和一个磁头。</p><p>当需要从磁盘读取数据时，系统会将数据逻辑地址传给磁盘，磁盘的控制电路按照寻址逻辑将逻辑地址翻译成物理地址，即确定要读的数据在哪个磁道，哪个扇区。为了读取这个扇区的数据，需要将磁头放到这个扇区上方，为了实现这一点，磁头需要移动对准相应磁道，这个过程叫做寻道，所耗费时间叫做寻道时间，然后磁盘旋转将目标扇区旋转到磁头下，这个过程耗费的时间叫做旋转时间。</p><h3 id="局部性原理与磁盘预读"><a href="#局部性原理与磁盘预读" class="headerlink" title="局部性原理与磁盘预读"></a>局部性原理与磁盘预读</h3><p>由于存储介质的特性，磁盘本身存取就比主存慢很多，再加上机械运动耗费，磁盘的存取速度往往是主存的几百分分之一，因此为了提高效率，要尽量减少磁盘 I/O。为了达到这个目的，磁盘往往不是严格按需读取，而是每次都会预读，即使只需要一个字节，磁盘也会从这个位置开始，顺序向后读取一定长度的数据放入内存。这样做的理论依据是计算机科学中著名的局部性原理：</p><p>当一个数据被用到时，其附近的数据也通常会马上被使用。</p><p>程序运行期间所需要的数据通常比较集中。</p><p>由于磁盘顺序读取的效率很高（不需要寻道时间，只需很少的旋转时间），因此对于具有局部性的程序来说，预读可以提高 I/O 效率。</p><p>预读的长度一般为页（page）的整倍数。页是计算机管理存储器的逻辑块，硬件及操作系统往往将主存和磁盘存储区分割为连续的大小相等的块，每个存储块称为一页（在许多操作系统中，页得大小通常为 4k），主存和磁盘以页为单位交换数据。当程序要读取的数据不在主存中时，会触发一个缺页异常，此时系统会向磁盘发出读盘信号，磁盘会找到数据的起始位置并向后连续读取一页或几页载入内存中，然后异常返回，程序继续运行。</p><h3 id="B-Tree索引的性能分析"><a href="#B-Tree索引的性能分析" class="headerlink" title="B-/+Tree索引的性能分析"></a>B-/+Tree索引的性能分析</h3><p>到这里终于可以分析 B-/+Tree 索引的性能了。</p><p>上文说过一般使用磁盘 I/O 次数评价索引结构的优劣。先从 B-Tree 分析，根据 B-Tree 的定义，可知检索一次最多需要访问 h 个节点。数据库系统的设计者巧妙利用了磁盘预读原理，将一个节点的大小设为等于一个页，这样每个节点只需要一次 I/O 就可以完全载入。为了达到这个目的，在实际实现 B-Tree 还需要使用如下技巧：</p><p>每次新建节点时，直接申请一个页的空间，这样就保证一个节点物理上也存储在一个页里，加之计算机存储分配都是按页对齐的，就实现了一个 node 只需一次 I/O。</p><p>B-Tree 中一次检索最多需要 h-1 次 I/O（根节点常驻内存），渐进复杂度为 $O \left (  \log_{d} N  \right )$。一般实际应用中，出度 d 是非常大的数字，通常超过 100，因此 h 非常小（通常不超过 3）。</p><p>综上所述，用 B-Tree 作为索引结构效率是非常高的。</p><p>而红黑树这种结构，h 明显要深的多。由于逻辑上很近的节点（父子）物理上可能很远，无法利用局部性，所以红黑树的 I/O 渐进复杂度也为 O(h)，效率明显比 B-Tree 差很多。</p><p>上文还说过，B+Tree 更适合外存索引，原因和内节点出度 d 有关。从上面分析可以看到，d 越大索引的性能越好，而出度的上限取决于节点内 key 和 data 的大小：</p><p>$$d_{max}= floor\left(pagesize/\left(keysize+datasize+pointsize\right)\right)$$</p><p>floor 表示向下取整。由于 B+Tree 内节点去掉了 data 域，因此可以拥有更大的出度，拥有更好的性能。</p><p>这一章从理论角度讨论了与索引相关的数据结构与算法问题，下一章将讨论 B+Tree 是如何具体实现为 MySQL 中索引，同时将结合 MyISAM 和 InnDB 存储引擎介绍非聚集索引和聚集索引两种不同的索引实现形式。</p><h1 id="MySQL索引实现"><a href="#MySQL索引实现" class="headerlink" title="MySQL索引实现"></a>MySQL索引实现</h1><p>在 MySQL 中，索引属于存储引擎级别的概念，不同存储引擎对索引的实现方式是不同的，本文主要讨论 MyISAM 和 InnoDB 两个存储引擎的索引实现方式。</p><h2 id="MyISAM索引实现"><a href="#MyISAM索引实现" class="headerlink" title="MyISAM索引实现"></a>MyISAM索引实现</h2><p>MyISAM 引擎使用 B+Tree 作为索引结构，叶节点的 data 域存放的是数据记录的地址。下图是 MyISAM 索引的原理图：</p><p></p><p>这里设表一共有三列，假设我们以 Col1 为主键，则图 8 是一个 MyISAM 表的主索引（Primary key）示意。可以看出 MyISAM 的索引文件仅仅保存数据记录的地址。在 MyISAM 中，主索引和辅助索引（Secondary key）在结构上没有任何区别，只是主索引要求 key 是唯一的，而辅助索引的 key 可以重复。如果我们在 Col2 上建立一个辅助索引，则此索引的结构如下图所示：</p><p></p><p>同样也是一颗 B+Tree，data 域保存数据记录的地址。因此，MyISAM 中索引检索的算法为首先按照 B+Tree 搜索算法搜索索引，如果指定的 Key 存在，则取出其 data 域的值，然后以 data 域的值为地址，读取相应数据记录。</p><p>MyISAM 的索引方式也叫做“非聚集”的，之所以这么称呼是为了与 InnoDB 的聚集索引区分。</p><h2 id="InnoDB索引实现"><a href="#InnoDB索引实现" class="headerlink" title="InnoDB索引实现"></a>InnoDB索引实现</h2><p>虽然 InnoDB 也使用 B+Tree 作为索引结构，但具体实现方式却与 MyISAM 截然不同。</p><p>第一个重大区别是 InnoDB 的数据文件本身就是索引文件。从上文知道，MyISAM 索引文件和数据文件是分离的，索引文件仅保存数据记录的地址。而在 InnoDB 中，表数据文件本身就是按 B+Tree 组织的一个索引结构，这棵树的叶节点 data 域保存了完整的数据记录。这个索引的 key 是数据表的主键，因此 InnoDB 表数据文件本身就是主索引。</p><p></p><p>图 10 是 InnoDB 主索引（同时也是数据文件）的示意图，可以看到叶节点包含了完整的数据记录。这种索引叫做聚集索引。因为 InnoDB 的数据文件本身要按主键聚集，所以 InnoDB 要求表必须有主键（MyISAM 可以没有），如果没有显式指定，则 MySQL 系统会自动选择一个可以唯一标识数据记录的列作为主键，如果不存在这种列，则 MySQL 自动为 InnoDB 表生成一个隐含字段作为主键，这个字段长度为 6 个字节，类型为长整形。</p><p>第二个与 MyISAM 索引的不同是 InnoDB 的辅助索引 data 域存储相应记录主键的值而不是地址。换句话说，InnoDB 的所有辅助索引都引用主键作为 data 域。例如，图 11 为定义在 Col3 上的一个辅助索引：</p><p></p><p>这里以英文字符的 ASCII 码作为比较准则。聚集索引这种实现方式使得按主键的搜索十分高效，但是辅助索引搜索需要检索两遍索引：首先检索辅助索引获得主键，然后用主键到主索引中检索获得记录。</p><p>了解不同存储引擎的索引实现方式对于正确使用和优化索引都非常有帮助，例如知道了 InnoDB 的索引实现后，就很容易明白为什么不建议使用过长的字段作为主键，因为所有辅助索引都引用主索引，过长的主索引会令辅助索引变得过大。再例如，用非单调的字段作为主键在 InnoDB 中不是个好主意，因为 InnoDB 数据文件本身是一颗 B+Tree，非单调的主键会造成在插入新记录时数据文件为了维持 B+Tree 的特性而频繁的分裂调整，十分低效，而使用自增字段作为主键则是一个很好的选择。</p><p>下一章将具体讨论这些与索引有关的优化策略。</p><h1 id="索引使用策略及优化"><a href="#索引使用策略及优化" class="headerlink" title="索引使用策略及优化"></a>索引使用策略及优化</h1><p>MySQL 的优化主要分为结构优化（Scheme optimization）和查询优化（Query optimization）。本章讨论的高性能索引策略主要属于结构优化范畴。本章的内容完全基于上文的理论基础，实际上一旦理解了索引背后的机制，那么选择高性能的策略就变成了纯粹的推理，并且可以理解这些策略背后的逻辑。</p><h2 id="示例数据库"><a href="#示例数据库" class="headerlink" title="示例数据库"></a>示例数据库</h2><p>为了讨论索引策略，需要一个数据量不算小的数据库作为示例。本文选用 MySQL 官方文档中提供的示例数据库之一：employees。这个数据库关系复杂度适中，且数据量较大。下图是这个数据库的 E-R 关系图（引用自 MySQL 官方手册）：</p><p></p><p>MySQL 官方文档中关于此数据库的页面为 <a href="http://dev.mysql.com/doc/employee/en/employee.html">http://dev.mysql.com/doc/employee/en/employee.html</a>。 里面详细介绍了此数据库，并提供了下载地址和导入方法，如果有兴趣导入此数据库到自己的 MySQL 可以参考文中内容。</p><h2 id="最左前缀原理与相关优化"><a href="#最左前缀原理与相关优化" class="headerlink" title="最左前缀原理与相关优化"></a>最左前缀原理与相关优化</h2><p>高效使用索引的首要条件是知道什么样的查询会使用到索引，这个问题和 B+Tree 中的“最左前缀原理”有关，下面通过例子说明最左前缀原理。</p><p>这里先说一下联合索引的概念。在上文中，我们都是假设索引只引用了单个的列，实际上，MySQL 中的索引可以以一定顺序引用多个列，这种索引叫做联合索引，一般的，一个联合索引是一个有序元组 <a1, a2, …, an>，其中各个元素均为数据表的一列，实际上要严格定义索引需要用到关系代数，但是这里我不想讨论太多关系代数的话题，因为那样会显得很枯燥，所以这里就不再做严格定义。另外，单列索引可以看成联合索引元素数为 1 的特例。</p><p>以 employees.titles 表为例，下面先查看其上都有哪些索引：</p><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line"><span class="keyword">SHOW</span> INDEX <span class="keyword">FROM</span> employees.titles;</span><br><span class="line"><span class="operator">+</span><span class="comment">--------+------------+----------+--------------+-------------+-------------+</span></span><br><span class="line"><span class="operator">|</span> <span class="keyword">Table</span>  <span class="operator">|</span> Non_unique <span class="operator">|</span> Key_name <span class="operator">|</span> Seq_in_index <span class="operator">|</span> Column_name <span class="operator">|</span> <span class="keyword">Cardinality</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">--------+------------+----------+--------------+-------------+-------------+</span></span><br><span class="line"><span class="operator">|</span> titles <span class="operator">|</span>          <span class="number">0</span> <span class="operator">|</span> <span class="keyword">PRIMARY</span>  <span class="operator">|</span>            <span class="number">1</span> <span class="operator">|</span> emp_no      <span class="operator">|</span>        <span class="keyword">NULL</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">|</span> titles <span class="operator">|</span>          <span class="number">0</span> <span class="operator">|</span> <span class="keyword">PRIMARY</span>  <span class="operator">|</span>            <span class="number">2</span> <span class="operator">|</span> title       <span class="operator">|</span>        <span class="keyword">NULL</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">|</span> titles <span class="operator">|</span>          <span class="number">0</span> <span class="operator">|</span> <span class="keyword">PRIMARY</span>  <span class="operator">|</span>            <span class="number">3</span> <span class="operator">|</span> from_date   <span class="operator">|</span>      <span class="number">443308</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">|</span> titles <span class="operator">|</span>          <span class="number">1</span> <span class="operator">|</span> emp_no   <span class="operator">|</span>            <span class="number">1</span> <span class="operator">|</span> emp_no      <span class="operator">|</span>      <span class="number">443308</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">--------+------------+----------+--------------+-------------+-------------+</span></span><br></pre></td></tr></table></figure><p>从结果中可以到 titles 表的主索引为 <emp_no, title, from_date>，还有一个辅助索引 <emp_no>。为了避免多个索引使事情变复杂（MySQL 的 SQL 优化器在多索引时行为比较复杂），这里我们将辅助索引 drop 掉：</p><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line"><span class="keyword">ALTER</span> <span class="keyword">TABLE</span> employees.titles <span class="keyword">DROP</span> INDEX emp_no;</span><br></pre></td></tr></table></figure><p>这样就可以专心分析索引 PRIMARY 的行为了。</p><h3 id="全列匹配"><a href="#全列匹配" class="headerlink" title="全列匹配"></a>全列匹配</h3><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line">EXPLAIN <span class="keyword">SELECT</span> <span class="operator">*</span> <span class="keyword">FROM</span> employees.titles <span class="keyword">WHERE</span> emp_no<span class="operator">=</span><span class="string">'10001'</span> <span class="keyword">AND</span> title<span class="operator">=</span><span class="string">'Senior Engineer'</span> <span class="keyword">AND</span> from_date<span class="operator">=</span><span class="string">'1986-06-26'</span>;</span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+-------------------+------+-------+</span></span><br><span class="line"><span class="operator">|</span> id <span class="operator">|</span> select_type <span class="operator">|</span> type  <span class="operator">|</span> key     <span class="operator">|</span> key_len <span class="operator">|</span> <span class="keyword">ref</span>               <span class="operator">|</span> <span class="keyword">rows</span> <span class="operator">|</span> Extra <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+-------------------+------+-------+</span></span><br><span class="line"><span class="operator">|</span>  <span class="number">1</span> <span class="operator">|</span> SIMPLE      <span class="operator">|</span> const <span class="operator">|</span> <span class="keyword">PRIMARY</span> <span class="operator">|</span> <span class="number">59</span>      <span class="operator">|</span> const,const,const <span class="operator">|</span>    <span class="number">1</span> <span class="operator">|</span>       <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+-------------------+------+-------+</span></span><br></pre></td></tr></table></figure><p>很明显，当按照索引中所有列进行精确匹配（这里精确匹配指“=”或“IN”匹配）时，索引可以被用到。这里有一点需要注意，理论上索引对顺序是敏感的，但是由于 MySQL 的查询优化器会自动调整 where 子句的条件顺序以使用适合的索引，例如我们将 where 中的条件顺序颠倒：</p><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line">EXPLAIN <span class="keyword">SELECT</span> <span class="operator">*</span> <span class="keyword">FROM</span> employees.titles <span class="keyword">WHERE</span> from_date<span class="operator">=</span><span class="string">'1986-06-26'</span> <span class="keyword">AND</span> emp_no<span class="operator">=</span><span class="string">'10001'</span> <span class="keyword">AND</span> title<span class="operator">=</span><span class="string">'Senior Engineer'</span>;</span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+-------------------+------+-------+</span></span><br><span class="line"><span class="operator">|</span> id <span class="operator">|</span> select_type <span class="operator">|</span> type  <span class="operator">|</span> key     <span class="operator">|</span> key_len <span class="operator">|</span> <span class="keyword">ref</span>               <span class="operator">|</span> <span class="keyword">rows</span> <span class="operator">|</span> Extra <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+-------------------+------+-------+</span></span><br><span class="line"><span class="operator">|</span>  <span class="number">1</span> <span class="operator">|</span> SIMPLE      <span class="operator">|</span> const <span class="operator">|</span> <span class="keyword">PRIMARY</span> <span class="operator">|</span> <span class="number">59</span>      <span class="operator">|</span> const,const,const <span class="operator">|</span>    <span class="number">1</span> <span class="operator">|</span>       <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+-------------------+------+-------+</span></span><br></pre></td></tr></table></figure><p>效果是一样的。</p><h3 id="最左前缀匹配"><a href="#最左前缀匹配" class="headerlink" title="最左前缀匹配"></a>最左前缀匹配</h3><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line">EXPLAIN <span class="keyword">SELECT</span> <span class="operator">*</span> <span class="keyword">FROM</span> employees.titles <span class="keyword">WHERE</span> emp_no<span class="operator">=</span><span class="string">'10001'</span>;</span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+------+---------+---------+-------+------+-------+</span></span><br><span class="line"><span class="operator">|</span> id <span class="operator">|</span> select_type <span class="operator">|</span> type <span class="operator">|</span> key     <span class="operator">|</span> key_len <span class="operator">|</span> <span class="keyword">ref</span>   <span class="operator">|</span> <span class="keyword">rows</span> <span class="operator">|</span> Extra <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+------+---------+---------+-------+------+-------+</span></span><br><span class="line"><span class="operator">|</span>  <span class="number">1</span> <span class="operator">|</span> SIMPLE      <span class="operator">|</span> <span class="keyword">ref</span>  <span class="operator">|</span> <span class="keyword">PRIMARY</span> <span class="operator">|</span> <span class="number">4</span>       <span class="operator">|</span> const <span class="operator">|</span>    <span class="number">1</span> <span class="operator">|</span>       <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+------+---------+---------+-------+------+-------+</span></span><br></pre></td></tr></table></figure><p>当查询条件精确匹配索引的左边连续一个或几个列时，如<code><emp_no></code>或<code><emp_no, title></code>，所以可以被用到，但是只能用到一部分，即条件所组成的最左前缀。上面的查询从分析结果看用到了 PRIMARY 索引，但是 key_len 为 4，说明只用到了索引的第一列前缀。</p><h3 id="查询条件用到了索引中列的精确匹配，但是中间某个条件未提供"><a href="#查询条件用到了索引中列的精确匹配，但是中间某个条件未提供" class="headerlink" title="查询条件用到了索引中列的精确匹配，但是中间某个条件未提供"></a>查询条件用到了索引中列的精确匹配，但是中间某个条件未提供</h3><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line">EXPLAIN <span class="keyword">SELECT</span> <span class="operator">*</span> <span class="keyword">FROM</span> employees.titles <span class="keyword">WHERE</span> emp_no<span class="operator">=</span><span class="string">'10001'</span> <span class="keyword">AND</span> from_date<span class="operator">=</span><span class="string">'1986-06-26'</span>;</span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+------+---------+---------+-------+------+-------------+</span></span><br><span class="line"><span class="operator">|</span> id <span class="operator">|</span> select_type <span class="operator">|</span> type <span class="operator">|</span> key     <span class="operator">|</span> key_len <span class="operator">|</span> <span class="keyword">ref</span>   <span class="operator">|</span> <span class="keyword">rows</span> <span class="operator">|</span> Extra       <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+------+---------+---------+-------+------+-------------+</span></span><br><span class="line"><span class="operator">|</span>  <span class="number">1</span> <span class="operator">|</span> SIMPLE      <span class="operator">|</span> <span class="keyword">ref</span>  <span class="operator">|</span> <span class="keyword">PRIMARY</span> <span class="operator">|</span> <span class="number">4</span>       <span class="operator">|</span> const <span class="operator">|</span>    <span class="number">1</span> <span class="operator">|</span> <span class="keyword">Using</span> <span class="keyword">where</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+------+---------+---------+-------+------+-------------+</span></span><br></pre></td></tr></table></figure><p>此时索引使用情况和情况二相同，因为 title 未提供，所以查询只用到了索引的第一列，而后面的 from_date 虽然也在索引中，但是由于 title 不存在而无法和左前缀连接，因此需要对结果进行扫描过滤 from_date（这里由于 emp_no 唯一，所以不存在扫描）。如果想让 from_date 也使用索引而不是 where 过滤，可以增加一个辅助索引 <emp_no, from_date>，此时上面的查询会使用这个索引。除此之外，还可以使用一种称之为“隔离列”的优化方法，将 emp_no 与 from_date 之间的“坑”填上。</p><p>首先我们看下 title 一共有几种不同的值：</p><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line"><span class="keyword">SELECT</span> <span class="keyword">DISTINCT</span>(title) <span class="keyword">FROM</span> employees.titles;</span><br><span class="line"><span class="operator">+</span><span class="comment">--------------------+</span></span><br><span class="line"><span class="operator">|</span> title              <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">--------------------+</span></span><br><span class="line"><span class="operator">|</span> Senior Engineer    <span class="operator">|</span></span><br><span class="line"><span class="operator">|</span> Staff              <span class="operator">|</span></span><br><span class="line"><span class="operator">|</span> Engineer           <span class="operator">|</span></span><br><span class="line"><span class="operator">|</span> Senior Staff       <span class="operator">|</span></span><br><span class="line"><span class="operator">|</span> Assistant Engineer <span class="operator">|</span></span><br><span class="line"><span class="operator">|</span> Technique Leader   <span class="operator">|</span></span><br><span class="line"><span class="operator">|</span> Manager            <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">--------------------+</span></span><br></pre></td></tr></table></figure><p>只有 7 种。在这种成为“坑”的列值比较少的情况下，可以考虑用“IN”来填补这个“坑”从而形成最左前缀：</p><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line">EXPLAIN <span class="keyword">SELECT</span> <span class="operator">*</span> <span class="keyword">FROM</span> employees.titlesWHERE emp_no<span class="operator">=</span><span class="string">'10001'</span><span class="keyword">AND</span> title <span class="keyword">IN</span> (<span class="string">'Senior Engineer'</span>, <span class="string">'Staff'</span>, <span class="string">'Engineer'</span>, <span class="string">'Senior Staff'</span>, <span class="string">'Assistant Engineer'</span>, <span class="string">'Technique Leader'</span>, <span class="string">'Manager'</span>)<span class="keyword">AND</span> from_date<span class="operator">=</span><span class="string">'1986-06-26'</span>;</span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+------+------+-------------+</span></span><br><span class="line"><span class="operator">|</span> id <span class="operator">|</span> select_type <span class="operator">|</span> type  <span class="operator">|</span> key     <span class="operator">|</span> key_len <span class="operator">|</span> <span class="keyword">ref</span>  <span class="operator">|</span> <span class="keyword">rows</span> <span class="operator">|</span> Extra       <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+------+------+-------------+</span></span><br><span class="line"><span class="operator">|</span>  <span class="number">1</span> <span class="operator">|</span> SIMPLE      <span class="operator">|</span> <span class="keyword">range</span> <span class="operator">|</span> <span class="keyword">PRIMARY</span> <span class="operator">|</span> <span class="number">59</span>      <span class="operator">|</span> <span class="keyword">NULL</span> <span class="operator">|</span>    <span class="number">7</span> <span class="operator">|</span> <span class="keyword">Using</span> <span class="keyword">where</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+------+------+-------------+</span></span><br></pre></td></tr></table></figure><p>这次 key_len 为 59，说明索引被用全了，但是从 type 和 rows 看出 IN 实际上执行了一个 range 查询，这里检查了 7 个 key。看下两种查询的性能比较：</p><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line"><span class="keyword">SHOW</span> PROFILES;</span><br><span class="line"><span class="operator">+</span><span class="comment">----------+---------------------------------------------------------------+</span></span><br><span class="line"><span class="operator">|</span> Duration <span class="operator">|</span> Query                                                                         <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----------+---------------------------------------------------------------+</span></span><br><span class="line"><span class="operator">|</span> <span class="number">0.000580</span> <span class="operator">|</span> <span class="keyword">SELECT</span> <span class="operator">*</span> <span class="keyword">FROM</span> employees.titles <span class="keyword">WHERE</span> emp_no<span class="operator">=</span><span class="string">'10001'</span> <span class="keyword">AND</span> from_date<span class="operator">=</span><span class="string">'1986-06-26'</span><span class="operator">|</span></span><br><span class="line"><span class="operator">|</span> <span class="number">0.000525</span> <span class="operator">|</span> <span class="keyword">SELECT</span> <span class="operator">*</span> <span class="keyword">FROM</span> employees.titles <span class="keyword">WHERE</span> emp_no<span class="operator">=</span><span class="string">'10001'</span> <span class="keyword">AND</span> title <span class="keyword">IN</span> ...          <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----------+---------------------------------------------------------------+</span></span><br></pre></td></tr></table></figure><p>“填坑”后性能提升了一点。如果经过 emp_no 筛选后余下很多数据，则后者性能优势会更加明显。当然，如果 title 的值很多，用填坑就不合适了，必须建立辅助索引。</p><h3 id="查询条件没有指定索引第一列"><a href="#查询条件没有指定索引第一列" class="headerlink" title="查询条件没有指定索引第一列"></a>查询条件没有指定索引第一列</h3><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line">EXPLAIN <span class="keyword">SELECT</span> <span class="operator">*</span> <span class="keyword">FROM</span> employees.titles <span class="keyword">WHERE</span> from_date<span class="operator">=</span><span class="string">'1986-06-26'</span>;</span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+------+------+---------+------+--------+-------------+</span></span><br><span class="line"><span class="operator">|</span> id <span class="operator">|</span> select_type <span class="operator">|</span> type <span class="operator">|</span> key  <span class="operator">|</span> key_len <span class="operator">|</span> <span class="keyword">ref</span>  <span class="operator">|</span> <span class="keyword">rows</span>   <span class="operator">|</span> Extra       <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+------+------+---------+------+--------+-------------+</span></span><br><span class="line"><span class="operator">|</span>  <span class="number">1</span> <span class="operator">|</span> SIMPLE      <span class="operator">|</span> <span class="keyword">ALL</span>  <span class="operator">|</span> <span class="keyword">NULL</span> <span class="operator">|</span> <span class="keyword">NULL</span>    <span class="operator">|</span> <span class="keyword">NULL</span> <span class="operator">|</span> <span class="number">443308</span> <span class="operator">|</span> <span class="keyword">Using</span> <span class="keyword">where</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+------+------+---------+------+--------+-------------+</span></span><br></pre></td></tr></table></figure><p>由于不是最左前缀，索引这样的查询显然用不到索引。</p><h3 id="匹配某列的前缀字符串"><a href="#匹配某列的前缀字符串" class="headerlink" title="匹配某列的前缀字符串"></a>匹配某列的前缀字符串</h3><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line">EXPLAIN <span class="keyword">SELECT</span> <span class="operator">*</span> <span class="keyword">FROM</span> employees.titles <span class="keyword">WHERE</span> emp_no<span class="operator">=</span><span class="string">'10001'</span> <span class="keyword">AND</span> title <span class="keyword">LIKE</span> <span class="string">'Senior%'</span>;</span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+------+------+-------------+</span></span><br><span class="line"><span class="operator">|</span> id <span class="operator">|</span> select_type <span class="operator">|</span> type  <span class="operator">|</span> key     <span class="operator">|</span> key_len <span class="operator">|</span> <span class="keyword">ref</span>  <span class="operator">|</span> <span class="keyword">rows</span> <span class="operator">|</span> Extra       <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+------+------+-------------+</span></span><br><span class="line"><span class="operator">|</span>  <span class="number">1</span> <span class="operator">|</span> SIMPLE      <span class="operator">|</span> <span class="keyword">range</span> <span class="operator">|</span> <span class="keyword">PRIMARY</span> <span class="operator">|</span> <span class="number">56</span>      <span class="operator">|</span> <span class="keyword">NULL</span> <span class="operator">|</span>    <span class="number">1</span> <span class="operator">|</span> <span class="keyword">Using</span> <span class="keyword">where</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+------+------+-------------+</span></span><br></pre></td></tr></table></figure><p>此时可以用到索引，<del>但是如果通配符不是只出现在末尾，则无法使用索引。</del>（原文表述有误，如果通配符 % 不出现在开头，则可以用到索引，但根据具体情况不同可能只会用其中一个前缀）</p><h3 id="范围查询"><a href="#范围查询" class="headerlink" title="范围查询"></a>范围查询</h3><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line">EXPLAIN <span class="keyword">SELECT</span> <span class="operator">*</span> <span class="keyword">FROM</span> employees.titles <span class="keyword">WHERE</span> emp_no <span class="operator"><</span> <span class="string">'10010'</span> <span class="keyword">and</span> title<span class="operator">=</span><span class="string">'Senior Engineer'</span>;</span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+------+------+-------------+</span></span><br><span class="line"><span class="operator">|</span> id <span class="operator">|</span> select_type <span class="operator">|</span> type  <span class="operator">|</span> key     <span class="operator">|</span> key_len <span class="operator">|</span> <span class="keyword">ref</span>  <span class="operator">|</span> <span class="keyword">rows</span> <span class="operator">|</span> Extra       <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+------+------+-------------+</span></span><br><span class="line"><span class="operator">|</span>  <span class="number">1</span> <span class="operator">|</span> SIMPLE      <span class="operator">|</span> <span class="keyword">range</span> <span class="operator">|</span> <span class="keyword">PRIMARY</span> <span class="operator">|</span> <span class="number">4</span>       <span class="operator">|</span> <span class="keyword">NULL</span> <span class="operator">|</span>   <span class="number">16</span> <span class="operator">|</span> <span class="keyword">Using</span> <span class="keyword">where</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+------+------+-------------+</span></span><br></pre></td></tr></table></figure><p>范围列可以用到索引（必须是最左前缀），但是范围列后面的列无法用到索引。同时，索引最多用于一个范围列，因此如果查询条件中有两个范围列则无法全用到索引。</p><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line">EXPLAIN <span class="keyword">SELECT</span> <span class="operator">*</span> <span class="keyword">FROM</span> employees.titlesWHERE emp_no <span class="operator"><</span> <span class="string">'10010'</span><span class="keyword">AND</span> title<span class="operator">=</span><span class="string">'Senior Engineer'</span><span class="keyword">AND</span> from_date <span class="keyword">BETWEEN</span> <span class="string">'1986-01-01'</span> <span class="keyword">AND</span> <span class="string">'1986-12-31'</span>;</span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+------+------+-------------+</span></span><br><span class="line"><span class="operator">|</span> id <span class="operator">|</span> select_type <span class="operator">|</span> type  <span class="operator">|</span> key     <span class="operator">|</span> key_len <span class="operator">|</span> <span class="keyword">ref</span>  <span class="operator">|</span> <span class="keyword">rows</span> <span class="operator">|</span> Extra       <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+------+------+-------------+</span></span><br><span class="line"><span class="operator">|</span>  <span class="number">1</span> <span class="operator">|</span> SIMPLE      <span class="operator">|</span> <span class="keyword">range</span> <span class="operator">|</span> <span class="keyword">PRIMARY</span> <span class="operator">|</span> <span class="number">4</span>       <span class="operator">|</span> <span class="keyword">NULL</span> <span class="operator">|</span>   <span class="number">16</span> <span class="operator">|</span> <span class="keyword">Using</span> <span class="keyword">where</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+------+------+-------------+</span></span><br></pre></td></tr></table></figure><p>可以看到索引对第二个范围索引无能为力。这里特别要说明 MySQL 一个有意思的地方，那就是仅用 explain 可能无法区分范围索引和多值匹配，因为在 type 中这两者都显示为 range。同时，用了“between”并不意味着就是范围查询，例如下面的查询：</p><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line">EXPLAIN <span class="keyword">SELECT</span> <span class="operator">*</span> <span class="keyword">FROM</span> employees.titlesWHERE emp_no <span class="keyword">BETWEEN</span> <span class="string">'10001'</span> <span class="keyword">AND</span> <span class="string">'10010'</span><span class="keyword">AND</span> title<span class="operator">=</span><span class="string">'Senior Engineer'</span><span class="keyword">AND</span> from_date <span class="keyword">BETWEEN</span> <span class="string">'1986-01-01'</span> <span class="keyword">AND</span> <span class="string">'1986-12-31'</span>;</span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+------+------+-------------+</span></span><br><span class="line"><span class="operator">|</span> id <span class="operator">|</span> select_type <span class="operator">|</span> type  <span class="operator">|</span> key     <span class="operator">|</span> key_len <span class="operator">|</span> <span class="keyword">ref</span>  <span class="operator">|</span> <span class="keyword">rows</span> <span class="operator">|</span> Extra       <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+------+------+-------------+</span></span><br><span class="line"><span class="operator">|</span>  <span class="number">1</span> <span class="operator">|</span> SIMPLE      <span class="operator">|</span> <span class="keyword">range</span> <span class="operator">|</span> <span class="keyword">PRIMARY</span> <span class="operator">|</span> <span class="number">59</span>      <span class="operator">|</span> <span class="keyword">NULL</span> <span class="operator">|</span>   <span class="number">16</span> <span class="operator">|</span> <span class="keyword">Using</span> <span class="keyword">where</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+-------+---------+---------+------+------+-------------+</span></span><br></pre></td></tr></table></figure><p>看起来是用了两个范围查询，但作用于 emp_no 上的“BETWEEN”实际上相当于“IN”，也就是说 emp_no 实际是多值精确匹配。可以看到这个查询用到了索引全部三个列。因此在 MySQL 中要谨慎地区分多值匹配和范围匹配，否则会对 MySQL 的行为产生困惑。</p><h3 id="查询条件中含有函数或表达式"><a href="#查询条件中含有函数或表达式" class="headerlink" title="查询条件中含有函数或表达式"></a>查询条件中含有函数或表达式</h3><p>很不幸，如果查询条件中含有函数或表达式，则 MySQL 不会为这列使用索引（虽然某些在数学意义上可以使用）。例如：</p><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line">EXPLAIN <span class="keyword">SELECT</span> <span class="operator">*</span> <span class="keyword">FROM</span> employees.titles <span class="keyword">WHERE</span> emp_no<span class="operator">=</span><span class="string">'10001'</span> <span class="keyword">AND</span> <span class="keyword">left</span>(title, <span class="number">6</span>)<span class="operator">=</span><span class="string">'Senior'</span>;</span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+------+---------+---------+-------+------+-------------+</span></span><br><span class="line"><span class="operator">|</span> id <span class="operator">|</span> select_type <span class="operator">|</span> type <span class="operator">|</span> key     <span class="operator">|</span> key_len <span class="operator">|</span> <span class="keyword">ref</span>   <span class="operator">|</span> <span class="keyword">rows</span> <span class="operator">|</span> Extra       <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+------+---------+---------+-------+------+-------------+</span></span><br><span class="line"><span class="operator">|</span>  <span class="number">1</span> <span class="operator">|</span> SIMPLE      <span class="operator">|</span> <span class="keyword">ref</span>  <span class="operator">|</span> <span class="keyword">PRIMARY</span> <span class="operator">|</span> <span class="number">4</span>       <span class="operator">|</span> const <span class="operator">|</span>    <span class="number">1</span> <span class="operator">|</span> <span class="keyword">Using</span> <span class="keyword">where</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+------+---------+---------+-------+------+-------------+</span></span><br></pre></td></tr></table></figure><p>虽然这个查询和情况五中功能相同，但是由于使用了函数 left，则无法为 title 列应用索引，而情况五中用 LIKE 则可以。再如：</p><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line">EXPLAIN <span class="keyword">SELECT</span> <span class="operator">*</span> <span class="keyword">FROM</span> employees.titles <span class="keyword">WHERE</span> emp_no <span class="operator">-</span> <span class="number">1</span><span class="operator">=</span><span class="string">'10000'</span>;</span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+------+------+---------+------+--------+-------------+</span></span><br><span class="line"><span class="operator">|</span> id <span class="operator">|</span> select_type <span class="operator">|</span> type <span class="operator">|</span> key  <span class="operator">|</span> key_len <span class="operator">|</span> <span class="keyword">ref</span>  <span class="operator">|</span> <span class="keyword">rows</span>   <span class="operator">|</span> Extra       <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+------+------+---------+------+--------+-------------+</span></span><br><span class="line"><span class="operator">|</span>  <span class="number">1</span> <span class="operator">|</span> SIMPLE      <span class="operator">|</span> <span class="keyword">ALL</span>  <span class="operator">|</span> <span class="keyword">NULL</span> <span class="operator">|</span> <span class="keyword">NULL</span>    <span class="operator">|</span> <span class="keyword">NULL</span> <span class="operator">|</span> <span class="number">443308</span> <span class="operator">|</span> <span class="keyword">Using</span> <span class="keyword">where</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+------+------+---------+------+--------+-------------+</span></span><br></pre></td></tr></table></figure><p>显然这个查询等价于查询 emp_no 为 10001 的函数，但是由于查询条件是一个表达式，MySQL 无法为其使用索引。看来 MySQL 还没有智能到自动优化常量表达式的程度，因此在写查询语句时尽量避免表达式出现在查询中，而是先手工私下代数运算，转换为无表达式的查询语句。</p><h2 id="索引选择性与前缀索引"><a href="#索引选择性与前缀索引" class="headerlink" title="索引选择性与前缀索引"></a>索引选择性与前缀索引</h2><p>既然索引可以加快查询速度，那么是不是只要是查询语句需要，就建上索引？答案是否定的。因为索引虽然加快了查询速度，但索引也是有代价的：索引文件本身要消耗存储空间，同时索引会加重插入、删除和修改记录时的负担，另外，MySQL 在运行时也要消耗资源维护索引，因此索引并不是越多越好。一般两种情况下不建议建索引。</p><p>第一种情况是表记录比较少，例如一两千条甚至只有几百条记录的表，没必要建索引，让查询做全表扫描就好了。至于多少条记录才算多，这个个人有个人的看法，我个人的经验是以 2000 作为分界线，记录数不超过 2000 可以考虑不建索引，超过 2000 条可以酌情考虑索引。</p><p>另一种不建议建索引的情况是索引的选择性较低。所谓索引的选择性（Selectivity），是指不重复的索引值（也叫基数，Cardinality）与表记录数（#T）的比值：</p><p>Index Selectivity = Cardinality / #T</p><p>显然选择性的取值范围为 (0, 1]，选择性越高的索引价值越大，这是由 B+Tree 的性质决定的。例如，上文用到的 employees.titles 表，如果 title 字段经常被单独查询，是否需要建索引，我们看一下它的选择性：</p><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line"><span class="keyword">SELECT</span> <span class="built_in">count</span>(<span class="keyword">DISTINCT</span>(title))<span class="operator">/</span><span class="built_in">count</span>(<span class="operator">*</span>) <span class="keyword">AS</span> Selectivity <span class="keyword">FROM</span> employees.titles;</span><br><span class="line"><span class="operator">+</span><span class="comment">-------------+</span></span><br><span class="line"><span class="operator">|</span> Selectivity <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">-------------+</span></span><br><span class="line"><span class="operator">|</span>      <span class="number">0.0000</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">-------------+</span></span><br></pre></td></tr></table></figure><p>title 的选择性不足 0.0001（精确值为0.00001579），所以实在没有什么必要为其单独建索引。</p><p>有一种与索引选择性有关的索引优化策略叫做前缀索引，就是用列的前缀代替整个列作为索引 key，当前缀长度合适时，可以做到既使得前缀索引的选择性接近全列索引，同时因为索引 key 变短而减少了索引文件的大小和维护开销。下面以 employees.employees 表为例介绍前缀索引的选择和使用。</p><p>从图 12 可以看到 employees 表只有一个索引 <emp_no>，那么如果我们想按名字搜索一个人，就只能全表扫描了：</p><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line">EXPLAIN <span class="keyword">SELECT</span> <span class="operator">*</span> <span class="keyword">FROM</span> employees.employees <span class="keyword">WHERE</span> first_name<span class="operator">=</span><span class="string">'Eric'</span> <span class="keyword">AND</span> last_name<span class="operator">=</span><span class="string">'Anido'</span>;</span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+------+------+---------+------+--------+-------------+</span></span><br><span class="line"><span class="operator">|</span> id <span class="operator">|</span> select_type <span class="operator">|</span> type <span class="operator">|</span> key  <span class="operator">|</span> key_len <span class="operator">|</span> <span class="keyword">ref</span>  <span class="operator">|</span> <span class="keyword">rows</span>   <span class="operator">|</span> Extra       <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+------+------+---------+------+--------+-------------+</span></span><br><span class="line"><span class="operator">|</span>  <span class="number">1</span> <span class="operator">|</span> SIMPLE      <span class="operator">|</span> <span class="keyword">ALL</span>  <span class="operator">|</span> <span class="keyword">NULL</span> <span class="operator">|</span> <span class="keyword">NULL</span>    <span class="operator">|</span> <span class="keyword">NULL</span> <span class="operator">|</span> <span class="number">300024</span> <span class="operator">|</span> <span class="keyword">Using</span> <span class="keyword">where</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----+-------------+------+------+---------+------+--------+-------------+</span></span><br></pre></td></tr></table></figure><p>如果频繁按名字搜索员工，这样显然效率很低，因此我们可以考虑建索引。有两种选择，建 <first_name> 或 <first_name, last_name>，看下两个索引的选择性：</p><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line"><span class="keyword">SELECT</span> <span class="built_in">count</span>(<span class="keyword">DISTINCT</span>(first_name))<span class="operator">/</span><span class="built_in">count</span>(<span class="operator">*</span>) <span class="keyword">AS</span> Selectivity <span class="keyword">FROM</span> employees.employees;</span><br><span class="line"><span class="operator">+</span><span class="comment">-------------+</span></span><br><span class="line"><span class="operator">|</span> Selectivity <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">-------------+</span></span><br><span class="line"><span class="operator">|</span>      <span class="number">0.0042</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">-------------+</span></span><br><span class="line"><span class="keyword">SELECT</span> <span class="built_in">count</span>(<span class="keyword">DISTINCT</span>(concat(first_name, last_name)))<span class="operator">/</span><span class="built_in">count</span>(<span class="operator">*</span>) <span class="keyword">AS</span> Selectivity <span class="keyword">FROM</span> employees.employees;</span><br><span class="line"><span class="operator">+</span><span class="comment">-------------+</span></span><br><span class="line"><span class="operator">|</span> Selectivity <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">-------------+</span></span><br><span class="line"><span class="operator">|</span>      <span class="number">0.9313</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">-------------+</span></span><br></pre></td></tr></table></figure><p><first_name> 显然选择性太低，<first_name, last_name> 选择性很好，但是 first_name 和 last_name 加起来长度为 30，有没有兼顾长度和选择性的办法？可以考虑用 first_name 和 last_name 的前几个字符建立索引，例如 <first_name, left(last_name, 3)>，看看其选择性：</p><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line"><span class="keyword">SELECT</span> <span class="built_in">count</span>(<span class="keyword">DISTINCT</span>(concat(first_name, <span class="keyword">left</span>(last_name, <span class="number">3</span>))))<span class="operator">/</span><span class="built_in">count</span>(<span class="operator">*</span>) <span class="keyword">AS</span> Selectivity <span class="keyword">FROM</span> employees.employees;</span><br><span class="line"><span class="operator">+</span><span class="comment">-------------+</span></span><br><span class="line"><span class="operator">|</span> Selectivity <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">-------------+</span></span><br><span class="line"><span class="operator">|</span>      <span class="number">0.7879</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">-------------+</span></span><br></pre></td></tr></table></figure><p>选择性还不错，但离 0.9313 还是有点距离，那么把 last_name 前缀加到 4：</p><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line"><span class="keyword">SELECT</span> <span class="built_in">count</span>(<span class="keyword">DISTINCT</span>(concat(first_name, <span class="keyword">left</span>(last_name, <span class="number">4</span>))))<span class="operator">/</span><span class="built_in">count</span>(<span class="operator">*</span>) <span class="keyword">AS</span> Selectivity <span class="keyword">FROM</span> employees.employees;</span><br><span class="line"><span class="operator">+</span><span class="comment">-------------+</span></span><br><span class="line"><span class="operator">|</span> Selectivity <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">-------------+</span></span><br><span class="line"><span class="operator">|</span>      <span class="number">0.9007</span> <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">-------------+</span></span><br></pre></td></tr></table></figure><p>这时选择性已经很理想了，而这个索引的长度只有 18，比 <first_name, last_name> 短了接近一半，我们把这个前缀索引建上：</p><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line"><span class="keyword">ALTER</span> <span class="keyword">TABLE</span> employees.employeesADD INDEX `first_name_last_name4` (first_name, last_name(<span class="number">4</span>));</span><br></pre></td></tr></table></figure><p>此时再执行一遍按名字查询，比较分析一下与建索引前的结果：</p><figure class="highlight sql"><table><tr><td class="code"><pre><span class="line"><span class="keyword">SHOW</span> PROFILES;</span><br><span class="line"><span class="operator">+</span><span class="comment">----------+----------------------------------------------------------------+</span></span><br><span class="line"><span class="operator">|</span> Duration <span class="operator">|</span> Query                                                          <span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----------+----------------------------------------------------------------+</span></span><br><span class="line"><span class="operator">|</span> <span class="number">0.119417</span> <span class="operator">|</span> <span class="keyword">SELECT</span> <span class="operator">*</span> <span class="keyword">FROM</span> employees.employees <span class="keyword">WHERE</span> first_name<span class="operator">=</span><span class="string">'Eric'</span> <span class="keyword">AND</span> last_name<span class="operator">=</span><span class="string">'Anido'</span><span class="operator">|</span></span><br><span class="line"><span class="operator">|</span> <span class="number">0.000924</span> <span class="operator">|</span> <span class="keyword">SELECT</span> <span class="operator">*</span> <span class="keyword">FROM</span> employees.employees <span class="keyword">WHERE</span> first_name<span class="operator">=</span><span class="string">'Eric'</span> <span class="keyword">AND</span> last_name<span class="operator">=</span><span class="string">'Anido'</span><span class="operator">|</span></span><br><span class="line"><span class="operator">+</span><span class="comment">----------+----------------------------------------------------------------+</span></span><br></pre></td></tr></table></figure><p>性能的提升是显著的，查询速度提高了 120 多倍。</p><p>前缀索引兼顾索引大小和查询速度，但是其缺点是不能用于 ORDER BY 和 GROUP BY 操作，也不能用于 Covering index（即当索引本身包含查询所需全部数据时，不再访问数据文件本身）。</p><h2 id="InnoDB的主键选择与插入优化"><a href="#InnoDB的主键选择与插入优化" class="headerlink" title="InnoDB的主键选择与插入优化"></a>InnoDB的主键选择与插入优化</h2><p>在使用 InnoDB 存储引擎时，如果没有特别的需要，请永远使用一个与业务无关的自增字段作为主键。</p><p>经常看到有帖子或博客讨论主键选择问题，有人建议使用业务无关的自增主键，有人觉得没有必要，完全可以使用如学号或身份证号这种唯一字段作为主键。不论支持哪种论点，大多数论据都是业务层面的。如果从数据库索引优化角度看，使用 InnoDB 引擎而不使用自增主键绝对是一个糟糕的主意。</p><p>上文讨论过 InnoDB 的索引实现，InnoDB 使用聚集索引，数据记录本身被存于主索引（一颗B+Tree）的叶子节点上。这就要求同一个叶子节点内（大小为一个内存页或磁盘页）的各条数据记录按主键顺序存放，因此每当有一条新的记录插入时，MySQL 会根据其主键将其插入适当的节点和位置，如果页面达到装载因子（InnoDB 默认为 15/16），则开辟一个新的页（节点）。</p><p>如果表使用自增主键，那么每次插入新的记录，记录就会顺序添加到当前索引节点的后续位置，当一页写满，就会自动开辟一个新的页。如下图所示：</p><p></p><p>这样就会形成一个紧凑的索引结构，近似顺序填满。由于每次插入时也不需要移动已有数据，因此效率很高，也不会增加很多开销在维护索引上。</p><p>如果使用非自增主键（如果身份证号或学号等），由于每次插入主键的值近似于随机，因此每次新纪录都要被插到现有索引页得中间某个位置：</p><p></p><p>此时 MySQL 不得不为了将新记录插到合适位置而移动数据，甚至目标页面可能已经被回写到磁盘上而从缓存中清掉，此时又要从磁盘上读回来，这增加了很多开销，同时频繁的移动、分页操作造成了大量的碎片，得到了不够紧凑的索引结构，后续不得不通过 OPTIMIZE TABLE 来重建表并优化填充页面。</p><p>因此，只要可以，请尽量在 InnoDB 上采用自增字段做主键。</p><h1 id="后记"><a href="#后记" class="headerlink" title="后记"></a>后记</h1><p>这篇文章断断续续写了半个月，主要内容就是上面这些了。不可否认，这篇文章在一定程度上有纸上谈兵之嫌，因为我本人对 MySQL 的使用属于菜鸟级别，更没有太多数据库调优的经验，在这里大谈数据库索引调优有点大言不惭。就当是我个人的一篇学习笔记了。</p><p>其实数据库索引调优是一项技术活，不能仅仅靠理论，因为实际情况千变万化，而且 MySQL 本身存在很复杂的机制，如查询优化策略和各种引擎的实现差异等都会使情况变得更加复杂。但同时这些理论是索引调优的基础，只有在明白理论的基础上，才能对调优策略进行合理推断并了解其背后的机制，然后结合实践中不断的实验和摸索，从而真正达到高效使用 MySQL 索引的目的。</p><p>另外，MySQL 索引及其优化涵盖范围非常广，本文只是涉及到其中一部分。如与排序（ORDER BY）相关的索引优化及覆盖索引（Covering index）的话题本文并未涉及，同时除 B-Tree 索引外 MySQL 还根据不同引擎支持的哈希索引、全文索引等等本文也并未涉及。如果有机会，希望再对本文未涉及的部分进行补充吧。</p><h1 id="参考文献"><a href="#参考文献" class="headerlink" title="参考文献"></a>参考文献</h1><p>[1] Baron Scbwartz等 著，王小东等 译；高性能MySQL（High Performance MySQL）；电子工业出版社，2010<br>[2] Michael Kofler 著，杨晓云等 译；MySQL5权威指南（The Definitive Guide to MySQL5）；人民邮电出版社，2006<br>[3] 姜承尧 著；MySQL技术内幕-InnoDB存储引擎；机械工业出版社，2011<br>[4] D Comer, Ubiquitous B-tree; ACM Computing Surveys (CSUR), 1979<br>[5] Codd, E. F. (1970). “A relational model of data for large shared data banks”. Communications of the ACM, , Vol. 13, No. 6, pp. 377-387<br>[6] MySQL5.1参考手册 - <a href="http://dev.mysql.com/doc/refman/5.1/zh/index.html">http://dev.mysql.com/doc/refman/5.1/zh/index.html</a></p>
</article>
</main></body></html>