3.3.1 准备lmdb数据集
3.3.1.1 LMDB API组成
path: 建立LMDB的路径(会自建文件夹,并将数据内容存储在文件夹下的data.mdb) queuesize: 缓存队列,指缓存图片数据的个数。默认为100,增加该数值会提高读写性能,但是对内存消耗较大 mapsize: LMDB建立时开辟的内存空间,LMDBDataset会在内存映射不够的时候自动翻倍data: tensor数据,只接受numpay.array格式或是含多个numpy.array的python list。数据类型可以是int8/uint8/int16/uint16/int32/uint32/float32。数据会 以原始shape存储。 lables: 图片的lable,需要是int类型,如果没有label不填该值即可。 keys: LMDB的键值,可以使用原始图片的文件名,但是需要注意LMDB数据会对存储的数据按键值进行排序,推荐使用唯一且递增的键值。如果不填该值,LMDB_Dataset会自动维护一个递增的键值。将缓存取内容存储,并关闭数据集。如果不使用该方法,程序会在结束的时候自动执行该方法。 但是如果python解释器崩溃,则会导致缓存区数据丢失。LMDB_Dataset支持使用python with语法管理资源。
3.3.1.2 LMDB API使用方式
3.3.1.3 示例代码
最后更新于