安装

我们推荐通过Clone项目到本地方式，这种方式下您可以：快速运行已有代码以及对需求的深度开发，例如：

直接运行已有的实验，使用预定义好的参数
快速实现自己的数据集加载器或数据增强方法，通过组件拼接，构建一个全新的 pipeline
修改已有组件的具体实现（如模型结构、数据加载逻辑、评价指标等）
添加新的模型或任务类型，扩展目前支持的功能范围
调整核心执行流程，例如添加新的训练协议或实验控制逻辑
与现有科研项目无缝集成，作为基础库或分析工具使用

💡下面将介绍ForensicHub中的四个组件（Dataset、Transform、Model、Evaluator）如何配合构建 pipeline。

Dataset

Dataset的职责是控制数据从硬盘中读入，具体实现为Pytorch中的Dataset类。您可以自定义任意方式读入数据，如从Json文件、CSV文件、直接遍历数据文件夹等，但Dataset类的返回必须为字典形式（形式定义在 ForensicHub/core/base_dataset.py），如：

dict = {
    "image": image_tensor,
    "label": label_tensor,
    "mask": mask_tensor,
    ...
}
return dict

其中，key名为image的键值对为必须项，其它key为可选项，用户可以自定义其它更多的键值对，如edge_mask、land_mark等。

TransformTransform的职责是配合Dataset读入的数据对数据进行数据预处理与数据增强等。Transform的接口形式定义在 ForensicHub/core/base_transform.py中，其中至少需要用户实现两个函数：get_train_transform、get_test_transform和get_post_transform。get_train_transform实现训练阶段的训练增强（通常包含图片的随机翻转、随机模糊等），get_test_transform实现测试阶段的增强（通常不包含随机操作），get_post_transform实现不同的数据标准化（例如标准Norm、ImageNet Norm等），如下为案例：

def get_post_transform(self) -> albu.Compose:
        """Get post-processing transforms like normalization and conversion to tensor."""
        if self.norm_type == 'image_net':
            return albu.Compose([
                albu.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
                ToTensorV2(transpose_mask=True)
            ])
        elif self.norm_type == 'clip':
            return albu.Compose([
                albu.Normalize(mean=[0.48145466, 0.4578275, 0.40821073], std=[0.26862954, 0.26130258, 0.27577711]),
                ToTensorV2(transpose_mask=True)
            ])
        elif self.norm_type == 'standard':
            return albu.Compose([
                albu.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5]),
                ToTensorV2(transpose_mask=True)
            ])
        elif self.norm_type == 'none':
            return albu.Compose([
                albu.ToFloat(max_value=255.0),  # 确保 uint8 转 float32，并映射到 [0, 1]
                ToTensorV2(transpose_mask=True)
            ])
        else:
            raise NotImplementedError("Normalization type not supported, use image_net, clip, standard or none")

def get_train_transform(self) -> albu.Compose:
        """Get training transforms."""
        return albu.Compose([
            # Flips
            albu.HorizontalFlip(p=0.5),
            albu.VerticalFlip(p=0.5),
            # Brightness and contrast fluctuation
            albu.RandomBrightnessContrast(
                brightness_limit=(-0.1, 0.1),
                contrast_limit=0.1,
                p=1
            ),
            albu.ImageCompression(
                quality_lower=70,
                quality_upper=100,
                p=0.2
            ),
            # Rotate
            albu.RandomRotate90(p=0.5),
            # Blur
            albu.GaussianBlur(
                blur_limit=(3, 7),
                p=0.2
            )
        ])
        
def get_test_transform(self) -> albu.Compose:
        """Get testing transforms."""
        return albu.Compose([
        ])

Model定义了模型相关部分，用户可以自定义模型结构，模型接口形式定义在 ForensicHub/core/base_model.py，但有两个注意事项：第一，模型的forward函数入参为一个字典，这个字典使用的键值对必须对齐Dataset中传出的字典，也就是使用的key必须存在于Dataset中传出的字典中。第二，模型的forward函数出参必须为一个字典，其中必须包含backward_loss，其它可视化等参数见 ForensicHub/core/base_model.py，下面为示例：

dict = {
            "backward_loss": combined_loss,
    
            # optional below
            "pred_mask": mask_pred,
            "visual_loss": {
                "combined_loss": combined_loss
            },
            "visual_image": {
                "pred_mask": mask_pred,
            }
        }
return dict

Evaluator定义了支持多卡的Pixel-和Image-level的11种指标。Evaluator部分使用了IMDLBenCo中已有的类，部分为ForensicHub中新的实现。您如果想要使用更多的指标，欢迎参见 ForensicHub/common/evaluation/AP.py进行自定义并合并到ForensicHub中，我们非常感谢您的贡献，或者您也可以在Github中提出issues说明您想要使用的指标，我们会第一时间迭代更新更多的Evaluator。