train_simsiam_colab.py

import datetime
import os
import shutil

import torch
from omegaconf import OmegaConf
from torch.utils.tensorboard import SummaryWriter

from data_loader.dataset_utils import ssl_dataset
from logger.logger import Logger
from selfsl.simsiam_trainer import SimSiamTrainer
from selfsl.ssl_models.simsiam import SimSiam
from utils.util import reproducibility, select_optimizer_pretrain, load_checkpoint, get_arguments,Cosine_LR_Scheduler


def main():
    args = get_arguments()
    myargs = []  # getopts(sys.argv)
    now = datetime.datetime.now()
    cwd = os.getcwd()
    if len(myargs) > 0:
        if 'c' in myargs:
            config_file = myargs['c']
    else:
        config_file = 'config/feature_learning_config_colab.yml'

    # for simSIAM

    config = OmegaConf.load(os.path.join(cwd, config_file))['trainer']
    config.cwd = str(cwd)
    reproducibility(config)

    dt_string = now.strftime("%d_%m_%Y_%H.%M.%S")
    cpkt_fol_name = os.path.join(config.save,
                                 f'checkpoints/dataset_{config.dataset.name}/model_{config.model.name}/date_'
                                 f'{dt_string}')

    log = Logger(path=cpkt_fol_name, name='LOG').get_logger()

    log.info(f"Checkpoint folder {cpkt_fol_name}")
    log.info(f"date and time = {dt_string}")

    log.info(f'pyTorch VERSION:{torch.__version__}', )
    log.info(f'CUDA VERSION')

    log.info(f'CUDNN VERSION:{torch.backends.cudnn.version()}')
    log.info(f'Number CUDA Devices: {torch.cuda.device_count()}')

    if args.tensorboard:

        # writer_path = os.path.join(config.save,
        #                            'checkpoints/model_' + config.model.name + '/dataset_' + config.dataset.name +
        #                            '/date_' + dt_string + '/runs/')

        writer = SummaryWriter(cpkt_fol_name + '/runs/')
    else:
        writer = None

    use_cuda = torch.cuda.is_available()

    device = torch.device("cuda:0" if use_cuda else "cpu")
    log.info(f'device: {device}')

    training_generator, val_generator, test_generator, class_dict = ssl_dataset(config)
    log.info(f'{len(training_generator)*256} {len(val_generator)} {len(test_generator)}')
    n_classes = len(class_dict)
    model = SimSiam(config,config.model.name)

    log.info(f"{model}")

    if (config.load):

        pth_file, _ = load_checkpoint(config.pretrained_cpkt, model, strict=True, load_seperate_layers=False)


    else:
        pth_file = None
    # if (config.cuda and use_cuda):
    #     if torch.cuda.device_count() > 1:
    #         log.info(f"Let's use {torch.cuda.device_count()} GPUs!")
    #
    #         model = torch.nn.DataParallel(model)
    model.to(device)
    config.model.optimizer.lr = float(config.model.optimizer.lr) * float(config.batch_size) * float(
        config.gradient_accumulation) / 256.0
    optimizer, scheduler = select_optimizer_pretrain(model, config['model'], None)
    scheduler = Cosine_LR_Scheduler(
        optimizer,
        warmup_epochs=5, warmup_lr=0,
        num_epochs=int(config.epochs), base_lr=config.model.optimizer.lr, final_lr=0,
        iter_per_epoch=len(training_generator)//int(config.gradient_accumulation),
        constant_predictor_lr=True # see the end of section 4.2 predictor
    )

    log.info(f'{model}')
    log.info(f"Checkpoint Folder {cpkt_fol_name} ")
    shutil.copy(os.path.join(config.cwd, config_file), cpkt_fol_name)
    log.info(f"Optimizer {config['model']['optimizer']['type']} LR {config['model']['optimizer']['lr']}")
    trainer = SimSiamTrainer(config, model=model, optimizer=optimizer,
                             data_loader=training_generator, writer=writer, logger=log,
                             valid_data_loader=val_generator, test_data_loader=test_generator, class_dict=class_dict,
                             lr_scheduler=scheduler,
                             checkpoint_dir=cpkt_fol_name)
    trainer.train()


if __name__ == '__main__':
    main()
import datetime
import os
import shutil

import torch
from omegaconf import OmegaConf
from torch.utils.tensorboard import SummaryWriter

from data_loader.dataset_utils import ssl_dataset
from logger.logger import Logger
from selfsl.simsiam_trainer import SimSiamTrainer
from selfsl.ssl_models.simsiam import SimSiam
from utils.util import reproducibility, select_optimizer_pretrain, load_checkpoint, get_arguments,Cosine_LR_Scheduler


def main():
    args = get_arguments()
    myargs = []  # getopts(sys.argv)
    now = datetime.datetime.now()
    cwd = os.getcwd()
    if len(myargs) > 0:
        if 'c' in myargs:
            config_file = myargs['c']
    else:
        config_file = 'config/feature_learning_config_colab.yml'

    # for simSIAM

    config = OmegaConf.load(os.path.join(cwd, config_file))['trainer']
    config.cwd = str(cwd)
    reproducibility(config)

    dt_string = now.strftime("%d_%m_%Y_%H.%M.%S")
    cpkt_fol_name = os.path.join(config.save,
                                 f'checkpoints/dataset_{config.dataset.name}/model_{config.model.name}/date_'
                                 f'{dt_string}')

    log = Logger(path=cpkt_fol_name, name='LOG').get_logger()

    log.info(f"Checkpoint folder {cpkt_fol_name}")
    log.info(f"date and time = {dt_string}")

    log.info(f'pyTorch VERSION:{torch.__version__}', )
    log.info(f'CUDA VERSION')

    log.info(f'CUDNN VERSION:{torch.backends.cudnn.version()}')
    log.info(f'Number CUDA Devices: {torch.cuda.device_count()}')

    if args.tensorboard:

        # writer_path = os.path.join(config.save,
        #                            'checkpoints/model_' + config.model.name + '/dataset_' + config.dataset.name +
        #                            '/date_' + dt_string + '/runs/')

        writer = SummaryWriter(cpkt_fol_name + '/runs/')
    else:
        writer = None

    use_cuda = torch.cuda.is_available()

    device = torch.device("cuda:0" if use_cuda else "cpu")
    log.info(f'device: {device}')

    training_generator, val_generator, test_generator, class_dict = ssl_dataset(config)
    log.info(f'{len(training_generator)*256} {len(val_generator)} {len(test_generator)}')
    n_classes = len(class_dict)
    model = SimSiam(config,config.model.name)

    log.info(f"{model}")

    if (config.load):

        pth_file, _ = load_checkpoint(config.pretrained_cpkt, model, strict=True, load_seperate_layers=False)


    else:
        pth_file = None
    # if (config.cuda and use_cuda):
    #     if torch.cuda.device_count() > 1:
    #         log.info(f"Let's use {torch.cuda.device_count()} GPUs!")
    #
    #         model = torch.nn.DataParallel(model)
    model.to(device)
    config.model.optimizer.lr = float(config.model.optimizer.lr) * float(config.batch_size) * float(
        config.gradient_accumulation) / 256.0
    optimizer, scheduler = select_optimizer_pretrain(model, config['model'], None)
    scheduler = Cosine_LR_Scheduler(
        optimizer,
        warmup_epochs=5, warmup_lr=0,
        num_epochs=int(config.epochs), base_lr=config.model.optimizer.lr, final_lr=0,
        iter_per_epoch=len(training_generator)//int(config.gradient_accumulation),
        constant_predictor_lr=True # see the end of section 4.2 predictor
    )

    log.info(f'{model}')
    log.info(f"Checkpoint Folder {cpkt_fol_name} ")
    shutil.copy(os.path.join(config.cwd, config_file), cpkt_fol_name)
    log.info(f"Optimizer {config['model']['optimizer']['type']} LR {config['model']['optimizer']['lr']}")
    trainer = SimSiamTrainer(config, model=model, optimizer=optimizer,
                             data_loader=training_generator, writer=writer, logger=log,
                             valid_data_loader=val_generator, test_data_loader=test_generator, class_dict=class_dict,
                             lr_scheduler=scheduler,
                             checkpoint_dir=cpkt_fol_name)
    trainer.train()


if __name__ == '__main__':
    main()