主頁 > 後端開發 > 為什么使用ioutil.ReadAll 函式需要注意

為什么使用ioutil.ReadAll 函式需要注意

2023-07-11 08:21:41 後端開發

1. 引言

當我們需要將資料一次性加載到記憶體中,ioutil.ReadAll 函式是一個方便的選擇,但是ioutil.ReadAll 的使用是需要注意的,

在這篇文章中,我們將首先對ioutil.ReadAll函式進行基本介紹,之后會介紹其存在的問題,以及引起該問題的原因,最后給出了ioutil.ReadAll 函式的替代操作,通過這些內容,希望能幫助你更好地理解和使用ioutil.ReadAll 函式,

2. 基本說明

ioutil.ReadAll其實是標準庫的一個函式,其作用是從Reader 引數讀取所有的資料,直到遇到EOF為止,函式定義如下:

func ReadAll(r io.Reader) ([]byte, error) 

其中r 為待讀取資料的Reader,資料讀取結果將以位元組切片的形式來回傳,如果讀取程序中遇到了錯誤,也會回傳對應的錯誤,

下面通過一個簡單的示例,來簡單說明ioutil.ReadAll 函式的使用:

package main

import (
        "fmt"
        "io/ioutil"
        "os"
)

func main() {
        filePath := "example.txt"

        // 打開檔案
        file, err := os.Open(filePath)
        if err != nil {
              fmt.Println("無法打開檔案:%s", err)
              return
        }
        defer file.Close()

        // 讀取檔案全部資料
        data, err := ioutil.ReadAll(file)
        if err != nil {
                fmt.Println("無法讀取檔案:%s", err)
                return
        }

        // 將讀取到的資料轉換為字串并輸出
        content := string(data)
        fmt.Println("檔案內容:")
        fmt.Println(content)
}

在這個示例中,我們使用os.Open 函式打開指定路徑的檔案,獲取到一個os.File 物件,接著,呼叫 ioutil.ReadAll 便能讀取到檔案的全部資料,

3. 為什么使用 ioutil.ReadAll 需要注意

從上面的基本說明我們可以得知,ioutil.ReadAll 的作用是讀取指定資料源的全部資料,并將其以位元組陣列的形式來回傳,比如,我們想要將整個檔案的資料加載到記憶體中,此時就可以使用 ioutil.ReadAll 函式來實作,

那這里就有一個問題, 加載一份資料到記憶體中,會耗費多少記憶體資源呢? 按照我們的理解,正常是資料源資料有多大,就大概消耗多大的記憶體資源,

然而,如果使用 ioutil.ReadAll 函式加載資料時消耗的記憶體資源,可能與我們的想法存在一些差距,通常使用 ioutil.ReadAll 函式加載全部資料有可能會消耗更多的記憶體,

下面我們創建一個10M的檔案,然后寫一個基準測驗函式,來展示使用 ioutil.ReadAll 加載整個檔案的資料,需要分配多少記憶體,函式如下:

func BenchmarkReadAllMemoryUsage(b *testing.B) {
   filePath := "largefile.txt"

   for n := 0; n < b.N; n++ {
      // 打開檔案
      file, err := os.Open(filePath)
      if err != nil {
         fmt.Println("無法打開檔案:%r", err)
         return
      }
      defer file.Close()
      _, err = ioutil.ReadAll(file)
      if err != nil {
         b.Fatal(err)
      }
   }
}

基準測驗的運行結果如下:

BenchmarkReadAllMemoryUsage-4                106          14385391 ns/op        52263424 B/op         42 allocs/op

其中106,表示基準測驗的迭代次數,14385391 ns/op, 表示每次迭代的平均執行時間,52263424 B/op表示每次迭代的平均記憶體分配量,42 allocs/op 表示每次迭代的平均分配次數,

上面基準測驗的結果,我們主要關注每次迭代需要消耗的記憶體量,也就是 52263424 B/op 這個資料,這個大概相當于50M左右,在這個示例中,我們使用 ioutil.ReadAll 加載一個10M大小的檔案,此時需要分配50M的記憶體,是檔案大小的5倍,

從這里我們可以看出,使用ioutil.ReadAll 加載資料時,存在的一個注意點,便是其分配的記憶體遠遠大于待加載資料的大小,

那我們就有疑問了,為什么 ioutil.ReadAll 加載資料時,會消耗這么多記憶體呢? 下面我們通過說明ioutil.ReadAll 函式的實作,來解釋其中的原因,

4. 為什么這么消耗記憶體

ioutil.ReadAll 函式的實作其實比較簡單,ReadAll 函式會初始化一個位元組切片緩沖區,然后呼叫源ReaderRead 方法不斷讀取資料,直接讀取到EOF 為止,

不過需要注意的是,ReadAll 函式初始化的緩沖區,其初始化大小只有512個位元組,在讀取程序中,如果緩沖區長度不夠,將會不斷擴容該緩沖區,直到緩沖區能夠容納所有待讀取資料為止,所以呼叫ioutil.ReadAll 可能會存在多次記憶體分配的現象,下面我們來看其代碼實作:

func ReadAll(r Reader) ([]byte, error) {
   // 初始化一個 512 個位元組長度的 位元組切片
   b := make([]byte, 0, 512)
   for {
      // len(b) == cap(b),此時緩沖區已滿,需要擴容
      if len(b) == cap(b) {
         // 首先append(b,0), 觸發切片的擴容機制
         // 然后再去掉前面 append 的 '0' 字符
         b = append(b, 0)[:len(b)]
      }
      // 呼叫Read 方法讀取資料
      n, err := r.Read(b[len(b):cap(b)])
      // 更新切片 len 欄位的值
      b = b[:len(b)+n]
      if err != nil {
         // 讀取到 EOF, 此時直接回傳
         if err == EOF {
            err = nil
         }
         return b, err
      }
   }
}

從上面代碼實作來看,使用 ioutil.ReadAll 加載資料需要分配大量記憶體的原因是因為切片的不斷擴容導致的,

ioutil.ReadAll 加載資料時,一開始只初始化了一個512位元組大小的切片,如果待加載的資料超過512位元組的話,切片會觸發擴容操作,同時其也不是一次性擴容到能夠容納所有資料的長度,而是基于切片的擴容機制來決定的,接下來可能會擴容到1024個位元組,會重新申請一塊記憶體空間,然后將原切片資料拷貝過去,

之后如果資料超過1024個位元組,切片會繼續擴容的操作,如此反復,直到切片能夠容納所有的資料為止,這個程序中會存在多次的記憶體分配的操作,導致大量記憶體的消耗,

因此,當使用 ioutil.ReadAll加載資料時,記憶體消耗會隨著資料的大小而增加,特別是在處理大檔案或大資料集時,可能需要分配大量的記憶體空間,這就解釋了為什么僅加載一個10M大小的檔案,就需要分配50M記憶體的現象,

5. 替換操作

既然 ioutil.ReadAll 這么消耗記憶體,那么我們應該盡量避免對其進行使用,但是有時候,我們又需要讀取全部資料到記憶體中,這個時候其實可以使用其他函式來替代ioutil.ReadAll,下面從檔案讀取和網路IO讀取這兩個方面來進行介紹,

5.1 檔案讀取

ioutil 工具包中,還存在一個ReadFile的工具函式,能夠加載檔案的全部資料到記憶體中,函式定義如下:

func ReadFile(filename string) ([]byte, error) {}

ReadFile函式的使用非常簡單,只需要傳入一個待加載檔案的路徑,回傳的資料為檔案的內容,下面通過一個基準函式,展示其加載檔案時需要的分配記憶體數等的資料,來和ioutil.ReadAll做一個比較:

func BenchmarkReadFileMemoryUsage(b *testing.B) {
   filePath := "largefile.txt"
   for n := 0; n < b.N; n++ {
      _, err := ioutil.ReadFile(filePath)
      if err != nil {
         b.Fatal(err)
      }
   }
}

上面基準測驗運行結果如下:

// ReadFile 函式基準測驗結果
BenchmarkReadFileMemoryUsage-4                592           1942212 ns/op        10494290 B/op          5 allocs/op
// ReadAll 函式基準測驗結果
BenchmarkReadAllMemoryUsage-4                106          14385391 ns/op        52263424 B/op         42 allocs/op

使用ReadFile加載整個檔案的資料,分配的記憶體數大概也為10M左右,同時執行時間和記憶體分配次數,也相對于ReadAll 函式來看,也相對更小,

因此,如果我們確實需要加載檔案的全部資料,此時使用ReadFile相對于ReadAll 肯定是更為合適的,

5.2 網路IO讀取

如果是網路IO操作,此時我們需要假定一個前提,是所有的回應資料,應該都是有回應頭的,能夠通過回應頭,獲取到回應體的長度,然后再基于此讀取全部回應體的資料,

這里可以使用io.Copy函式來將資料拷貝,從而來替代ioutil.ReadAll,下面是一個大概代碼結構:

package main

import (
        "bytes"
        "fmt"
        "io"
        "os"
)

func main() {
        // 1. 建立一個網路連接
        src := xxx
        defer src.Close()
        // 2. 讀取報文頭,獲取請求包的長度
        size := xxx
        // 3. 基于該 size 創建一個 位元組切片
        buf := make([]byte, size)
        buffer := bytes.NewBuffer(buf)
        // 4. 使用buffer來讀取資料
        _, err = io.Copy(&buffer, srcFile)
        if err != nil {
                fmt.Println("Failed to copy data:", err)
                return
        }
        // 現在資料已加載到記憶體中的緩沖區(buffer)中
        fmt.Println("Data loaded into buffer successfully.")
}

通過這種方式,能夠使用io.Copy 函式替換ioutil.ReadAll ,讀取到所有的資料,而io.Copy 函式不會存在 ioutil.ReadAll 函式存在的問題,

6. 總結

本文首先對 ioutil.ReadAll 進行了基本的說明,同時給了一個簡單的使用示例,

隨后,通過基準測驗展示了使用 ioutil.ReadAll 加載資料,消耗的記憶體可能遠遠大于待加載的資料,之后,通過對原始碼講解,說明了導致這個現象導致的原因,

最后,給出了一些替代方案,如使用 ioutil.ReadFile 函式和使用 io.Copy 函式等,以減少記憶體占用,基于以上內容,便完成了對ioutil.ReadAll 函式的介紹,希望對你有所幫助,

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/556997.html

標籤:其他

上一篇:為什么使用ioutil.ReadAll 函式需要注意

下一篇:返回列表

標籤雲
其他(162369) Python(38273) JavaScript(25530) Java(18294) C(15239) 區塊鏈(8275) C#(7972) AI(7469) 爪哇(7425) MySQL(7294) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5876) 数组(5741) R(5409) Linux(5347) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4615) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2438) ASP.NET(2404) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) HtmlCss(1995) .NET技术(1986) 功能(1967) Web開發(1951) C++(1942) python-3.x(1918) 弹簧靴(1913) xml(1889) PostgreSQL(1882) .NETCore(1863) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • 為什么使用ioutil.ReadAll 函式需要注意

    # 1. 引言 當我們需要將資料一次性加載到記憶體中,`ioutil.ReadAll` 函式是一個方便的選擇,但是`ioutil.ReadAll` 的使用是需要注意的。 在這篇文章中,我們將首先對`ioutil.ReadAll`函式進行基本介紹,之后會介紹其存在的問題,以及引起該問題的原因,最后給出了 ......

    uj5u.com 2023-07-11 08:21:41 more
  • 為什么使用ioutil.ReadAll 函式需要注意

    # 1. 引言 當我們需要將資料一次性加載到記憶體中,`ioutil.ReadAll` 函式是一個方便的選擇,但是`ioutil.ReadAll` 的使用是需要注意的。 在這篇文章中,我們將首先對`ioutil.ReadAll`函式進行基本介紹,之后會介紹其存在的問題,以及引起該問題的原因,最后給出了 ......

    uj5u.com 2023-07-11 08:20:28 more
  • Rust 使用egui創建一個簡單的下載器demo

    倉庫連接: https://github.com/GaN601/egui-demo-download-util 這是我第一個rust gui demo, 學習rust有挺長時間了, 但是一直沒有落實到實踐中, 本著對桌面應用的興趣, 考察了slint、egui兩種框架, 最后還是選擇了egui. 這 ......

    uj5u.com 2023-07-11 07:48:40 more
  • python筆記:第六章函式&方法

    # 1.系統函式 由系統提供,直接拿來用或是匯入模塊后使用 ``` a = 1.12386 result = round(a,2) print(result) > 1.12 ``` # 2.自定義函式 * 函式是結構化編程的核心 * 使用關鍵詞`def`來定義函式 ``` #函式定義 def fun ......

    uj5u.com 2023-07-11 07:48:37 more
  • == 與 equals 的區別?

    一. 介紹: Java中的 "==" 是一個運算子,是用于比較兩個物件地址值或基本資料型別之間的值是否相等。它的來源可以追溯到C語言,以及受C語言影響的許多其他編程語言。 Java中的equals() 是一個方法,可重寫該方法用于比較兩個物件屬性內容是否相等的方法。該方法繼承自Object類,在Ja ......

    uj5u.com 2023-07-11 07:48:32 more
  • Java 包、訪問修飾符

    # Java 包、訪問修飾符 # 1. 包 ## 包可以理解為創建不同的目錄來分別存放類,類似計算機當中檔案夾 > ## 通過包可以讓相同的類在不同的目錄下使用,防止重名的問題 > > ## 通過包可以很好的管理我們撰寫的類 > > ## 通過包可以控制訪問范圍 ## 使用 idea 工具創建包通過 ......

    uj5u.com 2023-07-11 07:48:27 more
  • Java入門11(JDBC)

    ## JDBC 驅動加載 => 連接創建 => 創建編譯 / 預編譯陳述句 => 獲取結果集 => 遍歷結果集 => 回傳結果集 | 介面 | | | | | | Driver | 驅動 | | Connection | 連接 | | Statement | 操作 | | ResultSet | 結果 ......

    uj5u.com 2023-07-11 07:46:29 more
  • C++類模板實作工廠模式(優化if else/switch case)

    引自:https://blog.csdn.net/weixin_43795921/article/details/127224633 template <typename IdentifierType, class AbstractProduct, class ProductCreator = Ab ......

    uj5u.com 2023-07-11 07:46:24 more
  • Java 中怎樣將 bytes 轉換為 long 型別?

    將bytes 轉換為long型別: 第一種方式: String 接收 bytes 的構造器轉成 String,再 Long.parseLong; 但此種情況需要注意:位元組陣列中的每個位元組都必須是有效的數字字符。如果位元組陣列包含非數字字符,則會引發NumberFormatException例外。確保在 ......

    uj5u.com 2023-07-11 07:46:20 more
  • String s=new String(“hello”)的執行程序

    一. 介紹 String 是Java.long包下的String類,是一個特殊的參考型別,用于表示字串。它提供了許多方法來操作和處理字串,比如連接、截取、查找、替換等。String類內部使用字符陣列( char[] ) 來存盤字串的內容,value欄位被final修飾,String物件一旦創建 ......

    uj5u.com 2023-07-11 07:46:13 more