#爬蓝调口琴网

论文写好了就没事干了,本来想去旅游,完蛋流量没了,所以静下心来学学口琴,网上有个蓝调口琴网挺好哒,想写个应用装手机里,先讲讲怎么爬吧。

主要还是用了request模块,然而由于网站用的是GBK编码,还需要iconv-lite、bufferhelper。

function get(url,callone,calltwo){
    var req = request(url, {timeout: 10000, pool: false});
    req.on('error', function(err) {
        console.log(err);
    });
    req.on('response', function(res) {
        var bufferHelper = new BufferHelper();
        res.on('data', function (chunk) {
            bufferHelper.concat(chunk);
        });
        res.on('end',function(){
            var result = iconv.decode(bufferHelper.toBuffer(),'GBK');
            callone(result,calltwo);
        });
    });
}

爬到了网页,用jquery来读里面的东西,用node-jquery就OK了

var env = require('jsdom').env;
env(html,function(err,window){
    var $ = require('jquery')(window);
})

这个脚本用了特愚蠢的字符串拼json的方法。。。所以趁脚本结束前还得把json封闭了。

process.on('exit',function(){
   fs.appendFileSync(FILE,'/b]}');
})