在 Go 语言下载文件 http.Get() 和 io.Copy() 章节我们讲解了如何使用 Go 实现一个下载器,可以实现下载任何大小的任意文件。

一般情况下,这个下载器已经足够使用了,但是,在下载文件时,我们往往想知道当前进度是多少。这时候,直接使用 io.Copy() 就无能为了。

实现下载文件进度的方法其实很简单,就是实现分段读取响应流。

因为响应是一个流 ( stream ) ,就像水管里的水一样,源源不竭,直到响应流读取完毕。所以实现下载进度的方法只有两种

使用 HTTP Content-Range 请求头断点续传的思维,实现多段分别下载。

从返回的响应流中分段读取。

第一种方式是断点续传,有空我们以后再讲,本章节我们来讲讲如何实现分段读取。

分段读取

分段读取的思想就像拿着一个桶从水龙头接水一样。当水桶满了就先倒出来,然后继续接水。

io.TeeReader() 方法

Go 语言的 io 包下的 io.TeeReader() 方法实现了分段读取的思想。该方法的原型如下

func TeeReader(r Reader, w Writer) Reader

io.TeeReader() 方法返回一个 Reader ,用于写入从 r 分段读取的内容。

很多人应该会对 w 这个参数疑惑。其实它就是一个中间水桶的作用。它从一个输入流中读取指定大小字节的数据,并把数据写入到另一个输出流中。

该方法没有内部缓冲 - 写入必须在读取完成之前完成。写入时遇到的任何错误都会报告为读取错误。

我们写一个小的范例演示下这个方法的使用

package main

import (

"bytes"

"fmt"

"io"

"io/ioutil"

"log"

"strings"

)

func main() {

r := strings.NewReader("some io.Reader stream to be read\n")

var buf bytes.Buffer

tee := io.TeeReader(r, &buf)

printall := func(r io.Reader) {

b, err := ioutil.ReadAll(r)

if err != nil {

log.Fatal(err)

}

fmt.Printf("%s", b)

}

printall(tee)

printall(&buf)

}

运行结果如下

[yufei@www.twle.cn helloworld]$ go run down.go

some io.Reader stream to be read

some io.Reader stream to be read

io.TeeReader() 实现下载进度

我们使用 io.TeeReader() 实现一个下载计数器来跟踪进度。

package main

import (

"fmt"

"io"

"net/http"

"os"

"strings"

)

// WriteCounter counts the number of bytes written to it. It implements to the io.Writer

// interface and we can pass this into io.TeeReader() which will report progress on each

// write cycle.

type WriteCounter struct {

Total uint64

}

func (wc *WriteCounter) Write(p []byte) (int, error) {

n := len(p)

wc.Total += uint64(n)

wc.PrintProgress()

return n, nil

}

func (wc WriteCounter) PrintProgress() {

// Clear the line by using a character return to go back to the start and remove

// the remaining characters by filling it with spaces

fmt.Printf("\r%s", strings.Repeat(" ", 35))

// Return again and print current status of download

// We use the humanize package to print the bytes in a meaningful way (e.g. 10 MB)

fmt.Printf("\rDownloading... %d B complete", wc.Total)

}

func main() {

fmt.Println("Download Started")

fileUrl := "https://dl.google.com/go/go1.11.1.src.tar.gz"

err := DownloadFile("go1.11.1.src.tar.gz", fileUrl)

if err != nil {

panic(err)

}

fmt.Println("Download Finished")

}

// DownloadFile will download a url to a local file. It's efficient because it will

// write as it downloads and not load the whole file into memory. We pass an io.TeeReader

// into Copy() to report progress on the download.

func DownloadFile(filepath string, url string) error {

// Create the file, but give it a tmp file extension, this means we won't overwrite a

// file until it's downloaded, but we'll remove the tmp extension once downloaded.

out, err := os.Create(filepath + ".tmp")

if err != nil {

return err

}

defer out.Close()

// Get the data

resp, err := http.Get(url)

if err != nil {

return err

}

defer resp.Body.Close()

// Create our progress reporter and pass it to be used alongside our writer

counter := &WriteCounter{}

_, err = io.Copy(out, io.TeeReader(resp.Body, counter))

if err != nil {

return err

}

// The progress use the same line so print a new line once it's finished downloading

fmt.Print("\n")

err = os.Rename(filepath+".tmp", filepath)

if err != nil {

return err

}

return nil

}

运行结果如下

[yufei@www.twle.cn helloworld]$ go run down.go

Download Started

Downloading... 21097206 B complete

Download Finished

[yufei@www.twle.cn helloworld]$

你自己试一下,那个数字是会自己跳动的。

整个实现中,最重要的是 WriteCounter 这个结构体,这个结构体下的 Write(p []byte) 方法的参数 p 就是每段读取的内容。