ncclInvalidArgument: Invalid value for an argument.
·
Error Note
pytorch 분산 처리 코드 부분에서 다음과 같은 에러가 발생하는 경우가 있습니다. File "/opt/conda/lib/python3.10/site-packages/torch/distributed/c10d_logger.py", line 47, in wrapper return func(*args, **kwargs) File "/opt/conda/lib/python3.10/site-packages/torch/distributed/distributed_c10d.py", line 2806, in all_gather work = default_pg.allgather([tensor_list], [tensor])torch.distributed.DistBackendError: NCCL error in..
ValueError: Cannot load <class 'diffusers.models.controlnet.ControlNetModel'> from / because the following keys are missing: Please make sure to pass `low_cpu_mem_usage=False` and `device_map=None` if you want to randomly initialize those weights or else
·
Error Note
[전체 에러문구]ValueError: Cannot load from / because the following keys are missing: Please make sure to pass `low_cpu_mem_usage=False` and `device_map=None` if you want to randomly initialize those weights or else make sure your checkpoint file is correct. 아래 코드로 controlnet 모델을 로드 할  때 발생하는 에러입니다.controlnet = ControlNetModel.from_pretrained('controlnet', t..
[dlib] dlib 설치시 에러
·
Error Note
dlib 설치 전 cmake 를 먼저 설치해줘야 합니다.하지만 cmake 를 설치 했음에도 불구하고 아래와 같은 에러 문구가 계속 뜬다면... ModuleNotFoundError: No module named 'cmake'     [해결방법]  1. 먼저 설치했던 cmake를 모두 제거합니다.sudo apt-get remove cmakesudo apt-get purge cmakesudo apt remove cmake which cmake 를 입력했을 때 아무것도 나오지 않아야 합니다. 2. 아래 버전으로 cmake와 dlib을 새로 설치해줍니다.pip install cmake==3.25.2pip install dlib==19.24.2    [참고 사이트]https://github.com/davisking..
TypeError: Unable to convert function return value to a Python type! The signature was () -> handle
·
Error Note
- 전체 에러 문구 TypeError: Unable to convert function return value to a Python type! The signature was () -> handle - 해결 방법 pip3 install numpy --upgrade