Files
Obsidian-Main/05. 資料收集/Keras.tensorflow - Dataset.md

706 B
Raw Blame History

可以使用 tensorflow.keras.utils.image_dataset_from_directory 來建立 dataset。 dataset 會有 data_batchlabel_batch 這兩個 member分別代表資料與標籤。 可以用 dataset.batch(32) 改變 batch size。 還有一些其他的有用function:

  • shuffle(buffer_size): 打亂順序,可參考Keras.tensorflow - shuffle#^832c8c
  • prefetch(buffer_size): 設定預讀的大小
  • map(callback_func): 用 callback_func 來處理資料
  • take(N): 取出第N筆的批次資料注意這一筆是一個批次資料裡面可能有32筆資料或其他數量看你的 dataset.batch(N) 怎麼設定)。

打亂data的方法請看Keras.tensorflow - shuffle