访问并读取页面数据

在下边这个程序中,数组中的url都将被访问:会发送一个简单的http.Head()请求查看返回值;它的声明如下:func Head(url string) (r *Response, err error)

返回状态码会被打印出来。

示例 15.7 poll_url.go

package main

import (
    "fmt"
    "net/http"
)

var urls = []string{
    "http://www.google.com/",
    "http://golang.org/",
    "http://blog.golang.org/",
}

func main() {
    // Execute an HTTP HEAD request for all url's
    // and returns the HTTP status string or an error string.
    for _, url := range urls {
        resp, err := http.Head(url)
        if err != nil {
            fmt.Println("Error:", url, err)
        }
        fmt.Println(url, ": ", resp.Status)
    }
}

输出为:

译者注 由于国内的网络环境现状,很有可能见到如下超时错误提示:

在下边的程序中我们使用http.Get()获取网页内容; Get的返回值res中的Body属性包含了网页内容,然后我们用ioutil.ReadAll把它读出来:

示例 15.8 http_fetch.go

当访问不存在的网站时,这里有一个CheckError输出错误的例子:

译者注 和上一个例子相似,你可以把google.com更换为一个国内可以顺畅访问的网址进行测试

在下边的程序中,我们获取一个twitter用户的状态,通过xml包将这个状态解析成为一个结构:

示例 15.9 twitter_status.go

输出:

译者注 和上边的示例相似,你可能无法获取到xml数据,另外由于go版本的更新,xml.Unmarshal函数的第一个参数需是[]byte类型,而无法传入Body

我们会在章节15.4中用到http包中的其他重要的函数:

  • http.Redirect(w ResponseWriter, r *Request, url string, code int):这个函数会让浏览器重定向到url(是请求的url的相对路径)以及状态码。

  • http.NotFound(w ResponseWriter, r *Request):这个函数将返回网页没有找到,HTTP 404错误。

  • http.Error(w ResponseWriter, error string, code int):这个函数返回特定的错误信息和HTTP代码。

  • http.Request对象的一个重要属性reqreq.Method,这是一个包含GETPOST字符串,用来描述网页是以何种方式被请求的。

go为所有的HTTP状态码定义了常量,比如:

你可以使用w.header().Set("Content-Type", "../..")设置头信息

比如在网页应用发送html字符串的时候,在输出之前执行w.Header().Set("Content-Type", "text/html")

练习 15.4:扩展 http_fetch.go 使之可以从控制台读取url,使用章节12.1学到的接收控制台输入的方法 (http_fetch2.go

练习 15.5:获取json格式的推特状态,就像示例 15.9(twitter_status_json.go)

链接

Last updated