• Chunked编码

    2008-04-24

    Chunked编码
    转载

    有时候,Web服务器生成HTTP Response是无法在Header就确定消息大小的,这时一般来说服务器将不会提供Content-Length的头信息,而采用Chunked编码动态的提供body内容的长度。

    进行Chunked编码传输的HTTP Response会在消息头部设置:

    Transfer-Encoding: chunked

    表示Content Body将用Chunked编码传输内容。

    Chunked编码使用若干个Chunk串连而成,由一个标明长度为0的chunk标示结束。每个Chunk分为头部和正文两部分,头部内容指定下一段正 文的字符总数(十六进制的数字)和数量单位(一般不写),正文部分就是指定长度的实际内容,两部分之间用回车换行(CRLF)隔开。在最后一个长度为0的 Chunk中的内容是称为footer的内容,是一些附加的Header信息(通常可以直接忽略)。具体的Chunk编码格式如下:

      Chunked-Body = *chunk
             "0" CRLF
             footer
             CRLF
      chunk = chunk-size [ chunk-ext ] CRLF
          chunk-data CRLF

      hex-no-zero = <HEX excluding "0">

      chunk-size = hex-no-zero *HEX
      chunk-ext = *( ";" chunk-ext-name [ "=" chunk-ext-value ] )
      chunk-ext-name = token
      chunk-ext-val = token | quoted-string
      chunk-data = chunk-size(OCTET)

      footer = *entity-header

    RFC文档中的Chunked解码过程如下:

      length := 0//用来记录解码后的数据体长度
      read chunk-size, chunk-ext (if any) and CRLF//第一次读取块大小
      while (chunk-size > 0) { //一直循环,直到读取的块大小为0
      read chunk-data and CRLF //读取块数据体,以回车结束
      append chunk-data to entity-body //添加块数据体到解码后实体数据
      length := length + chunk-size //更新解码后的实体长度
      read chunk-size and CRLF //读取新的块大小
      }
      read entity-header //以下代码读取全部的头标记
      while (entity-header not empty) {
      append entity-header to existing header fields
      read entity-header
      }
      Content-Length := length //头标记中添加内容长度
      Remove "chunked" from Transfer-Encoding  //头标记中移除Transfer-Encoding

    最后提供一段PHP版本的chunked解码代码:

    $chunk_size = (integer)hexdec(fgets( $socket_fd, 4096 ) );
    while(!feof($socket_fd) && $chunk_size > 0) {
        
    $bodyContent .= fread( $socket_fd, $chunk_size );
        
    fread( $socket_fd, 2 ); // skip \r\n
        
    $chunk_size = (integer)hexdec(fgets( $socket_fd, 4096 ) );
    }

    收藏到:Del.icio.us




    Tag:

发表评论

您将收到博主的回复邮件
记住我