JavaScript 浮点数计算问题

JavaScript 浮点数神坑当属 0.1 + 0.2 == 0.3false

> 0.1 + 0.2 == 0.3
false
> 0.1 + 0.2
0.30000000000000004
>

还有一些比较隐蔽的问题,比如 Math.roundNumber.prototype.toFixed 也都不是能完全正常工作的。

> Math.round(1.105 * 100)
111
> Math.round(1.015 * 100)
101
> Math.round(1.025 * 100)
102
> 0.25.toFixed(1)
'0.3'
> 0.35.toFixed(1)
'0.3'

Math.round、toFixed 计算出错主要因为浮点数不能精确表示。

在这里 0.35 和 1.015 的值都不准确,一个办法是转换成整数计算再除以对应的十百千;另一个办法是采用现有的 lib,比如 accounting

> 1.015 * 100
101.49999999999999

代码运行环境

D:\node -v
v8.1.0

JavaScript const、let、var 对比

ECMAScript 6 新增 const 和 let 命令,用来声明变量。

声明方式 变量提升 作用域 初始值 重复定义
const 块级 需要 不允许
let 块级 不需要 不允许
var 函数级 不需要 允许

变量提升:const 和 let 必须先声明再使用,不支持变量提升

console.log(c1, l1, v1);
// 报错
// Uncaught ReferenceError: c1 is not defined

const c1 = 'c1';
let l1 = 'l1';
var v1 = 'v1';

作用域:const,let 支持块级作用域,有效避免变量覆盖

const c21 = 'c21';
let l21 = 'l21';
var v21 = 'v21';

if (0.1 + 0.2 != 0.3) {
    const c21 = 'c22';
    let l21 = 'l22';
    var v21 = 'v22';

    console.log(c21, l21, v21);
    // 输出 c22 l22 v22
}

console.log(c21, l21, v21);
// 输出 c21 l21 v22

块级作用域,在外层不能直接访问内层变量

if (0.1 + 0.2 != 0.3) {
    const c22 = 'c22';
    let l22 = 'l22';
    var v22 = 'v22';

    console.log(c22, l22, v22);
    // 输出 c22 l22 v22
}

console.log(c22, l22, v22);
// 报错
// Uncaught ReferenceError: c22 is not defined
// 同样地, l22 is not defined

const 定义常量,该常量不能赋值,但该常量的属性可以赋值

const c231 = {};
const c232 = [];

c231.name = 'seven';
c232.push(27);

console.log(c231, c232);
// 输出 {name: "seven"} [27]

// 禁止给对象赋值,应该使用 Object.freeze

const c233 = Object.freeze({});
const c234 = Object.freeze([]);

c233.name = 'seven';
// 普通模式下不报错
// 严格模式下报错
// Uncaught TypeError: Cannot add property name, object is not extensible
    
c234.push(27);
// 普通模式下就会报错
// Uncaught TypeError: Cannot add property 0, object is not extensible

console.log(c233, c234);
// 输出 {} []

全局变量不再设置为顶层对象(window)的属性,有效避免全局变量污染

const c24 = 'c24';
let l24 = 'l24';

console.log(c24, l24);
// 输出 c24 l24

console.log(window.c24, window.l24);
// 输出 undefined undefined

符合预期的 for 循环

for (var i = 0; i != 3; i++) {
    setTimeout(function() {
        console.log(i);
    },10);
}
// 依次打印
3
3
3

for (let i = 0; i != 3; i++) {
    setTimeout(function() {
        console.log(i);
    },10);
}
// 依次打印,为啥呢
0
1
2

可以看到在 for 循环中使用 let 方式声明变量才是符合预期。
在 for 中每一次循环,let 都是重新声明变量,并且因为 JavaScript 引擎会记住上一次循环的值,初始化 i 时在上一轮的基础上计算。

可以看到在 for 循环中至少有两层作用域,看下面的例子更容易理解。

for (let i = 0; i != 3; i++) {
    let i = 'seven';
    console.log(i);
}
console.log('eight');
// 依次打印
seven
seven
seven
eight

初始值:const 声明的变量必须设置初始值,且不能重复赋值。

const c3 = 'c3';
let l3 = 'l3';
var v3 = 'v3';

console.log(c3, l3, v3);
// 输出 c3 l3 v3

c3 = 2; // Uncaught TypeError: Assignment to constant variable
l3 = 2;
v3 = 2;

console.log(c3, l3, v3);
// 输出 c3 2 2

const c32;
// 报错
// Uncaught SyntaxError: Missing initializer in const declaration

重复定义:const 和 let 不支持重复定义

const、let 缩小了变量作用域,完美避免变量污染;const 固定变量(即固定变量类型),对于弱类型 JavaScript 来说,可以明显提升性能。推荐在应用中使用 const、let 声明变量。

使用 JavaScript 对中文进行排序

在网页上展示列表时经常需要对列表进行排序:按照修改/访问时间排序、按照地区、按照名称排序。

对于中文列表按照名称排序就是按照拼音排序,不能简单通过字符串比较—— ‘a’ > ‘b’——这种方式来实现。

比如比较 ‘北京’ vs ‘上海’,实际是比较 ‘běijīng’ vs ‘shànghǎi’;比较 ‘北京’ vs ‘背景’,实际是比较 ‘běijīng’ vs ‘bèijǐng’。
一般需要获取到字符串的拼音,再比较各自的拼音。

JavaScript 提供本地化文字排序,比如对中文按照拼音排序,不需要程序显示比较字符串拼音。

String.prototype.localeCompare 在不考虑多音字的前提下,基本可以完美实现按照拼音排序。

在没有出现意外的情况下,各个支持 localeCompare 的浏览器都很正常。最近将 Chrome 更新到 58.0.3029.110,突然发现中文排序不正常。

// 正常应该返回 1, 拼音 jia 在前, kai 在后
'开'.localeCompare('驾');
// 得到
-1;

// Chrome 58.0.3029.110 下返回 -1, 其他浏览器正常

// 确认之后是 localeCompare 需要明确指定 locales 参数
'开'.localeCompare('驾', 'zh');
// 得到
1

在 Chrome 下传递 locales 参数才能获得正常预期结果

Edge 浏览器支持 localeCompare

Firefox 浏览器支持 localeCompare

IE 11 浏览器支持 localeCompare

其他浏览器对 localeCompare 支持也很友好,目前也不需要明确传递 locales,浏览器支持参考 developer.mozilla.org

JavaScript Proxy 代理

Proxy 对象可以捕获源对象(对象、数组、函数)的操作,包括增删改查(获取、赋值、枚举、删除)以及函数调用,可以更加全面地控制源对象。

代理对象

// 源对象 必须是复杂数据类型,如 对象、数组、函数
var target = {age: 27};

var handler = {
    get: function(target, key) {
        // 代理 target[key]
        console.log('get');
        if (key in target) {
            return target[key];
        }
    },
    set: function(target, key, value) {
        // 代理 target[key] = value
        console.log('set');
        target[key] = value;
    },
    deleteProperty: function(target, key) {
        // 代理 delete target[key]
        console.log('deleteProperty');
        return key in target ? delete target[key] : false;
    },
    enumerate: function(target, key) {
        console.log('enumerate');
        return Object.keys(target);
    },
    ownKeys: function(target, key) {
        // 代理 Object.getOwnPropertyNames(target)
        // 代理 Object.getOwnPropertySymbols(target)
        console.log('ownKeys');
        return Object.keys(target);
    },
    has: function(target, key) {
        // 代理 key in target
        console.log('has');
        return key in target;
    },
    defineProperty: function(target, key, desc) {
        // 代理 Object.defineProperty(proxy, key, desc)
        console.log('defineProperty');
        Object.defineProperty(target, key, desc);
        return target;
    },
    getOwnPropertyDescriptor: function(target, key) {
        console.log('getOwnPropertyDescriptor');
        return key in target ? {
            value: target[key],
            writable: true,
            enumerable: false,
            configurable: true
        } : undefined;    
    }
};

// 新建代理
var proxy = new Proxy(target, handler);

proxy.age;

proxy.age = 28;

Object.defineProperty(proxy, 'name', {value: 'seven'});

proxy.name;
target.name;

Object.keys(proxy),会分别调用 handler.ownKeys 和 getOwnPropertyDescriptor,前者用于获取 target 的 key 列表,后者用于依次判断每个 key 是否可以迭代。
若 getOwnPropertyDescriptor 返回值得 enumerate 为 false,则该 key 不会出现在 Object.keys(proxy) 返回结果中。

Object.getOwnPropertyDescriptors(proxy) 和 Object.keys(proxy) 一样,会分别调用 handler.ownKeys 和 getOwnPropertyDescriptor,但不会根据 getOwnPropertyDescriptor 返回结果过滤 key。


代理数组

var target = [1, 2, 3];

var handler = {
    set: function(target, key, value) {
        // 代理 target[key] = value
        console.log('set');
        target[key] = value;
        // 代理数组 set,需要 返回源对象
        // 代理对象不需要
        return target;
    }
};

var proxy = new Proxy(target, handler);

proxy.push(4);
proxy.pop();
proxy.unshift(5);
proxy.shift();

代理数组 handler.set 需要返回源对象,其余与代理对象一致。


代理函数

var target = function (name) {
    this.name = name;

    this.sayHello = function() {
        return 'Hi, I am ' + this.name;
    };

    return 'Hi, I am ' + name;
};

var handler = {
    construct: function(target, args) {
        console.log('construct');
        var inst = Object.create(target.prototype);
        target.apply(inst, args);
        return inst;
    },
    apply: function(target, args)  {
        console.log('apply');
        return target.apply(target, args);
    }
};

var proxy = new Proxy(target, handler);

proxy();

var inst = new proxy('seven');
inst.sayHello();

代理函数可以设置 handler.construct 和 handler.apply,其余与代理对象一致。


创建可以撤销的代理

var target = {age: 27};

var handler = {
    get: function(target, key) {
        // 代理 target[key]
        console.log('get');
        if (key in target) {
            return target[key];
        }
    }
};

var revocable = Proxy.revocable(target, handler);
var proxy = revocable.proxy;

proxy.age;

// 执行撤销
revocable.revoke();

// 撤销之后再执行任何代理操作都会报错

// TypeError
proxy.age;

推荐HTTP站点使用CSP禁止网页被注入的未知JS脚本执行

无意间发现站点 ua.zhengxianjun.com 的 Network 中出现两条未知的 js 请求。

未知的 js 请求

这两个域名跟 ua.zhengxianjun.com 没有任何关系,查看源码发现网页被注入了一个 script 标签。

注入的 script 标签,来自 i.fcy6.cc

刚开始以为网站被黑了,可是黑我的小网站没意思呀。

在服务器上访问 ua.zhengxianjun.com 发现一切正常,感觉可能是被运营商注入了广告。

通过 curl 访问,显示正常

在 Network 中看到第二条脚本没有加载成功,可能是这个原因网页没有出现异常。试了多次也没出现广告。

网页被插入一个 script 标签,第1个创建了第2个

查了一下域名 fcy6.cc,但对方开启了隐私保护。

从另外一个域名 sho9wbox.com 的 whois 信息可以看到,它属于 veryci.com,跟电驴(verycd.com)非常接近。

veryci.com 官网大部分是图片,而且用词不清。最主要是启信宝上的公司地址跟官网的地址不一样。(如下图)

当然这些都不是重点。

重点是:推荐 HTTP 站点启用 CSP,尽量保证即使网页被注入脚本,也不会出现危害。

如何使用 CSP,参考 https://blog.zhengxianjun.com/2015/04/web-security-csp/

在 Firefox 下 bootstrap-datetimepicker 报错

日期插件 bootstrap-datetimepicker 在火狐下出现一条报错

TypeError: (intermediate value).toString(…).split(…)[1] is undefined

这条错误必然出现,难道没有在 Firefox 下进行测试。

在 Firefox 下查看项目 demo (http://www.malot.fr/bootstrap-datetimepicker/demo.php)可以正常运行,但这个 demo.php 使用的是 2013-3-2 的 datetimepicker,github 项目(https://github.com/smalot/bootstrap-datetimepicker/releases)已经发布到 2017-3-3,这个最新的版本(以及最近的一些版本)在 Firefox 下测试不完善,计算 defaultTimeZone 时虽然没有出错,但给出的结果也不正确

源代码如下,运行环境 Firefox 51.0.1(32位)

this.defaultTimeZone = (new Date).toString().split('(')[1].slice(0, -1);
this.timezone = options.timezone || this.defaultTimeZone;

// 2.4.4 改进版本
this.timezone = options.timezone || timeZoneAbbreviation();

function timeZoneAbbreviation() {
    var abbreviation, date, formattedStr, i, len, matchedStrings, ref, str;
    date = (new Date()).toString();
    formattedStr = ((ref = date.split('(')[1]) != null ? ref.slice(0, -1) : 0) || date.split(' ');
    if (formattedStr instanceof Array) {
        matchedStrings = [];
        for (var i = 0, len = formattedStr.length; i < len; i++) {
            str = formattedStr[i];
            if ((abbreviation = (ref = str.match(/\b[A-Z]+\b/)) !== null) ? ref[0] : 0) {
                matchedStrings.push(abbreviation);
            }
        }
        formattedStr = matchedStrings.pop();
    }
    return formattedStr;
}

出错原因是 Firefox 下 Date.prototype.toString 返回结果不包含 TimeZone 的文字描述。

2.4.4 改进版本使用的 timeZoneAbbreviation 函数在 Firefox 下返回  true


对 timeZoneAbbreviation 使用的三元表达式依次简化

  • ((abbreviation = (ref = str.match(/\b[A-Z]+\b/)) !== null) ? ref[0] : 0)
  • (abbreviation = (ref = str.match(/\b[A-Z]+\b/)) !== null)
  • (abbreviation = (xxx) !== null)
  • (abbreviation = xxx !== null)

abbreviation 必然是布尔值,如果将 matchedStrings.push(abbreviation) 换成 matchedStrings.push(str) 更接近预期值。

推荐使用文末的方案。


  • Firefox date toString 返回结果没有(中国标准时间)“, 因此 split('(')[1] 是 undefined

  • Chrome date toString 返回结果包含 “(中国标准时间)

  • IE/Edge date toString 返回结果包含 “(中国标准时间)

解决方案

将 date toString 最后一个空格之后的字符串作为 TimeZone。

// this.defaultTimeZone = (new Date).toString().split('(')[1].slice(0, -1);
this.defaultTimeZone = (new Date + '').split(' ').slice(-1)[0].replace(/\(|\)/g, '');
this.timezone = options.timezone || this.defaultTimeZone;

Closure-Compiler 指定 charset 减少输出文件大小

Google 的 Closure-Compiler  压缩 JavaScript 文件默认采用 UTF-8 作为输入编码,US_ASCII 作为输出编码。

–charset VAL : Input and output charset for all files
. By default, we accept UTF-8 as input
and output US_ASCII

因此,压缩汉字(或者日韩文字)之后,文件会变大。

执行命令 java -jar $dir/compiler.jar --js $cache_file --js_output_file $output_file

// 输入文件
var address = '上海';

// 输出文件
var address="\u4e0a\u6d77";

源文件较小时可以忽略这个问题,但源文件有大量汉字,可以指定 charset 避免输出文件过大。

执行命令 java -jar $dir/compiler.jar --js $cache_file --js_output_file $output_file --charset=UTF-8

// 输入文件
var address = '上海';

// 输出文件
var address="上海";

在开发中遇到一个 1.5MB 的地址文件,压缩之后变成 3MB,再经 gzip 压缩变成 780 KB 左右。而源文件经 gzip 之后在 590 KB。

JavaScript 获取两个字符串最长公共子串 (Longest Common Subsequence)

获取两个字符串 a 和 b 的最长公共子串,时间复杂度 O(mn),空间复杂度 O(n),其中 a 的字符串长度为 m,b 的字符串长度为 n。

function lcs(a, b) {
    var ai, al = a.length,
        bi, bl = b.length - 1, maxBi,
        max = 0, val,
        row = [],
        ret = [];

    for (ai = 0; ai < al; ai++) {
        for (bi = bl; bi > -1; bi--) {
            val = a[ai] == b[bi] ? 1 : 0;
            if (val) {
                if (row[bi - 1]) {
                    val += row[bi - 1];
                }
                if (val > max) {
                    max = val;
                    maxBi = bi;
                }
            }
            row[bi] = val;
        }
    }

    for (; max > 0; max--, maxBi--) {
        ret.unshift(b[maxBi]);
    }

    return ret.join('');
}

详细分析 setInterval 和 setTimeout 区别

理解两者区别需要先知道:

  1. JavaScript 是单线程
  2. setInterval 是周期性地调用一个函数(一段可执行代码)
  3. setTimeout 是在一定延迟之后调用一个函数(一段可执行代码)
function cost150ms(){
    // 该函数执行 150ms
}
function testTimeout() {
    // 函数在 150ms 之后执行
}
function testInterval() {
    // 函数在 150ms、200ms、300ms、400ms... 执行
}

setTimeout(testTimeout, 100);
setInterval(testInterval, 100);
cost150ms();

结论

setTimeout(callable, 100);
otherCode();

callable 是周期性执行,不管 otherCode 执行多长时间。
如果到达下一个周期,otherCode 仍然在执行,则 callable 被推迟到 otherCode 执行完毕,即产生“跳过”。
所以上面的例子中能看到 callable 第一次执行是 150ms,第二次执行时 200ms,两次执行只相差 50ms。
假如在某个周期 otherCode 仍在在执行,则该周期 callable 继续被推迟到 otherCode 执行完毕。

setTimeout(callable, 100);
otherCode();

callable 调用时间是 otherCode 执行时间与 100ms 最大值。

setInterval 和 setTimeout 都有可能出现推迟执行,setInterval 由于是周期性执行,表现上更像是“跳过”,setTimeout 更像是推迟。

实际场景不会是刚刚等于 150ms、200ms,但接近该值。

使用JavaScript库jQuery.qrcode生成二维码

在线二维码生成器

使用开源二维码库 jquery.qrcode.js (https://github.com/jeromeetienne/jquery-qrcode)在浏览器上直接生成二维码,不需要后端程序支持。该库对中文不友好。

生成二维码

$('#qrcode')
	.empty(()
	.qrcode({
		render: window.CanvasPattern ? 'canvas' : 'table',
		width: 300,
		height: 300,
		text: 'blog.zhengxianjun.com'
	});

jquery.qrcode 核心是 qrcode.js,jquery.qrcode.js 将其封装成了 jQuery 扩展,封装代码很少。以表格 table 模式可以使在不支持 canvas 的浏览器下也能正常运行。

二维码配置

var options = {
	render        : "canvas", // 渲染方式 table|canvas
	width         : 256, // 二维码宽度
	height        : 256, // 二维码高度
	typeNumber    : -1, // 计算模式
	correctLevel  : QRErrorCorrectLevel.H, // 纠错等级
	background    : "#ffffff", // 背景色
	foreground    : "#000000" // 前景色
};

中文二维码

jquery.qrcode 使用 charCodeAt 转码,charCodeAt 使用的 2 位的 Unicode 编码,中文字符采用 3 位的 UTF8 编码,两者长度不匹配,导致生成二维码的源字符流有误。

需要先将 UTF16 转 UTF8,实现来自 http://www.onicos.com/staff/iz/amuse/javascript/expert/utf.txt

function utf16to8(str) {
	var out, i, len, c;
	out = '';
	len = str.length;
	for(i = 0; i < len; i++) { c = str.charCodeAt(i); if ((c >= 0x0001) && (c <= 0x007F)) { out += str.charAt(i); } else if (c > 0x07FF) {
			out += String.fromCharCode(0xE0 | ((c >> 12) & 0x0F));
			out += String.fromCharCode(0x80 | ((c >>  6) & 0x3F));
			out += String.fromCharCode(0x80 | ((c >>  0) & 0x3F));
		} else {
			out += String.fromCharCode(0xC0 | ((c >>  6) & 0x1F));
			out += String.fromCharCode(0x80 | ((c >>  0) & 0x3F));
		}
	}
	return out;
}