본문 바로가기

분류 전체보기42

의존성 정리 (2) TokenizersTokenizers 라이브러리가 ComfyUI에서 담당하는 역할을 그림 그리기 과정에 빗대어 설명해드리겠습니다:언어 해석사: 화가가 고객의 요구사항을 단어별로 정확히 이해해야 하듯이, Tokenizers는 사용자가 입력한 텍스트 프롬프트를 AI가 이해할 수 있는 토큰(작은 단위)으로 분해합니다. "해질녘 바닷가의 고양이"라는 프롬프트를 ["해질녘", "바닷가", "의", "고양이"]와 같이 분해하는 역할을 합니다.언어 번역기: 화가가 고객의 언어를 그림 언어로 번역하듯, Tokenizers는 인간 언어를 AI 모델이 이해할 수 있는 숫자 형태로 변환합니다. 각 단어나 부분 단어가 고유한 ID로 변환됩니다.어휘 사전 관리자: 화가가 자신만의 색상 팔레트와 기법 사전을 갖고 있듯이, Tok.. 2025. 3. 19.
의존성 정리 (1) NumPyComfyUI에서 NumPy가 하는 역할을 그림 그리기 과정에 빗대어 설명해드리겠습니다:측정 도구와 자: NumPy는 디지털 캔버스에서 픽셀 위치와 값을 정확하게 측정하고 조작하는 도구입니다. 화가가 정확한 비율과 위치를 측정하는 것처럼 NumPy는 이미지 데이터를 정밀하게 다룹니다.팔레트 정리사: 토치(PyTorch)가 실제로 그림을 그릴 때, NumPy는 색상 데이터를 효율적으로 정리하고 변환합니다. 색상 배열을 만들고, 회전하고, 크기를 조정하는 등의 기본 작업을 처리합니다.이미지 처리사: 완성된 이미지를 저장하거나 표시하기 전에 NumPy는 이미지 데이터를 조작합니다. 예를 들어 픽셀 값 정규화, 이미지 자르기, 크기 조정 등의 작업을 수행합니다.데이터 변환기: ComfyUI가 다양한 형.. 2025. 3. 18.
파이토치부터 이해하기 토치(Pytorch)에 대하여ComfyUI는 Stable Diffusion 및 다양한 AI 이미지/비디오 생성 모델을 위한 그래프 기반 인터페이스입니다. PyTorch는 이런 AI 모델들의 핵심 엔진으로 작동하는 중요한 의존성입니다.PyTorch가 필요한 이유:텐서 연산 제공: PyTorch는 GPU 가속을 지원하는 텐서 연산 라이브러리입니다. ComfyUI의 기반 모델들(SD1.x, SDXL, Stable Cascade 등)은 모두 복잡한 텐서 연산을 필요로 합니다.딥 러닝 프레임워크: ComfyUI에서 사용하는 모든 AI 모델들은 PyTorch로 개발되었습니다. 첫 번째 문서에서 볼 수 있듯이 ComfyUI는 모델을 실행하기 위해 PyTorch를 사용합니다.GPU 가속: ComfyUI는 문서에 언급된.. 2025. 3. 17.
다중 의상 학습부터 최적화까지 데이터셋 구축 및 정리LoRA 모델을 효과적으로 학습시키기 위해서는 우수한 데이터셋 구축이 필수적입니다. 데이터의 질이 높을수록 모델이 더욱 정교한 결과를 도출할 수 있습니다.이미지 수집:게임 내 3D 모델을 활용한 스크린샷 캡처예를 들어, Honkai Impact 3rd, Genshin Impact 같은 게임에서는 3D 모델을 활용한 스크린샷 촬영이 가능하며, 이를 통해 보다 정교한 데이터셋을 구축할 수 있습니다.Danbooru/Gelbooru 같은 사이트에서 아트워크 수집특정 캐릭터를 기반으로 검색하여 다양한 스타일의 아트워크를 수집할 수 있습니다.Google 이미지 검색을 활용한 보충Booru 사이트에서 부족한 이미지를 보충하는 데 유용하며, 다양한 팬아트나 공식 아트워크도 포함할 수 있습니다.애니.. 2025. 2. 26.