用Golang写爬虫(一) - Golang教程网

之前一直都是再用Python写爬虫，最近想体验下Golang写爬虫的感觉，所以就有了这个系列。我想要抓取的页面是豆瓣Top250页面，选择它的理由有3个:

我们先看第一版的代码。

按逻辑我把抓取代码分成2个部分：

我们先看HTTP请求，Golang语言的HTTP请求库不需要使用第三方的库，标准库就内置了足够好的支持：

我把URL请求的逻辑都放在了fetch函数中，里面做了一些异常处理。值得说的有2点：

接着就是解析页面的部分：

strings.Replace(body, "\n", "", -1).*FindAllStringSubmatchFindStringSubmatch

Top250页面是要翻页的，最后在main函数里面实现抓取全部Top250页面。另外为了和之后的改进做对比，我们加上代码运行耗时的逻辑：

strconv.Itoa

运行起来非常快：

通过终端输出可以看到我们拿到了对应电影条目的ID和电影标题！

完整代码可以在这个地址找到。