diffusers中blip描述使用详解

2023-12-15 20:31:33

1 blip细节

2 blip读取代码

if __name__ == '__main__':
    args = parse_args()
    blix_list = []
    img_list = []
    for file_name in os.listdir(args.dataset_dir):
        if file_name.endswith(".txt"):
            continue
        img_list.append(file_name)
    if args.blip_type == "in_one_txt":
        import pdb
        pdb.set_trace()
        file = open(args.blip_path, "r") # xxx/blip.txt 
        
        tmp = file.readlines()
        k_v = {}
        for i in tmp:
            t = i.replace('\n', '').split('|')
            k_v[t[0]] = t[1]
        for i in img_list:
            
            import pdb
            # pdb.set_trace()
            
            blix_list.append(k_v[i])

0 首先看args.dataset_dir就是数据集位置,里面有blip.txt文件
然后如果是txt结尾就跳过
如果是png jpg就留下
这里可以做如下改进

for file_name in os.listdir(args.dataset_dir):
        if file_name.endswith(".txt"):
            continue
        if file_name.endswith(".png") of file_name.endswith(".jpg"):
        img_list.append(file_name)

因此img_list是所有非txt结尾文件名!!!

1 args.blip_path
/share/huanggao/zjc/code_mid/data/test_data/blip.txt'

2 tmp是列表

3 for i in tmp
'0726_yitian_diffusion_sketch_9.jpg|a woman posing for the camera\n'

4 以|分割str
t[0]????????????????????????????????????????????????????????????????????????????????
'0726_yitian_diffusion_sketch_9.jpg'??????
t[1]?????????????????????????????????????????
'a woman posing for the camera'

5 k_v[t[0]] = t[1] 构成字典

6 img_list里面是所有图片名

文章来源:https://blog.csdn.net/zjc910997316/article/details/135023680
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。