코로나 데이터 분석
코로나 확진자 및 사망자 추이 분석
코로나19 팬데믹 동안 확진자와 사망자의 변화를 분석하는 것은 전염병의 확산을 이해하는 데 중요한 역할을 합니다. 데이터를 기반으로 시간에 따른 확진자 수와 사망자 수의 변화를 시각적으로 분석하여 전염병의 진행 양상을 살펴볼 수 있습니다.
import pandas as pd
import matplotlib.pyplot as plt
# 데이터 로드
covid_df = pd.read_csv('covid19_data.csv')
covid_df['date'] = pd.to_datetime(covid_df['date'])
# 시계열 그래프 생성
plt.figure(figsize=(15, 8))
plt.plot(covid_df['date'], covid_df['new_cases'], label='신규 확진자')
plt.plot(covid_df['date'], covid_df['new_deaths'], label='신규 사망자')
plt.title('COVID-19 일일 확진자 및 사망자 추이')
plt.xlabel('날짜')
plt.ylabel('인원')
plt.xticks(rotation=45)
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.show()
백신 접종과 확진자 감소의 관계 분석
백신 접종률이 증가함에 따라 확진자 수에 미치는 영향을 분석하는 것은 방역 정책 수립에 도움이 됩니다.
주식 데이터 시각화
주가 변동성 및 추세 분석
주식 시장의 변동성을 분석하고 장기적인 이동 평균선을 활용하여 시장의 흐름을 파악할 수 있습니다.
import pandas as pd
import matplotlib.pyplot as plt
import mplfinance as mpf
# 주식 데이터 로드
stock_df = pd.read_csv('stock_data.csv')
stock_df['Date'] = pd.to_datetime(stock_df['Date'])
stock_df.set_index('Date', inplace=True)
# 캔들스틱 차트
mpf.plot(stock_df, type='candle', volume=True, title='주가 차트', style='charles', figsize=(15, 8))
이동평균선 추가 및 일일 수익률 분석
# 이동평균선 추가
stock_df['MA5'] = stock_df['Close'].rolling(window=5).mean()
stock_df['MA20'] = stock_df['Close'].rolling(window=20).mean()
stock_df['MA60'] = stock_df['Close'].rolling(window=60).mean()
# 일간 수익률 분포 분석
stock_df['Daily_Return'] = stock_df['Close'].pct_change()
sns.histplot(data=stock_df['Daily_Return'].dropna(), bins=50)
plt.title('일간 수익률 분포')
plt.show()
인구통계 데이터 분석
연령대별 인구 피라미드 분석
인구 피라미드는 연령대별 성별 분포를 시각화하여 사회 구조 변화를 파악하는 데 유용합니다.
import pandas as pd
import matplotlib.pyplot as plt
# 데이터 로드
pop_df = pd.read_csv('population_data.csv')
def create_population_pyramid(data, year):
male_data = data[data['gender'] == 'Male'].sort_values('age_group')
female_data = data[data['gender'] == 'Female'].sort_values('age_group')
plt.figure(figsize=(12, 8))
plt.barh(male_data['age_group'], -male_data['population'], color='skyblue', label='남성')
plt.barh(female_data['age_group'], female_data['population'], color='pink', label='여성')
plt.title(f'{year}년 인구 피라미드')
plt.xlabel('인구 수')
plt.ylabel('연령대')
plt.legend()
plt.grid(True, alpha=0.3)
plt.show()
고령화 지수 분석
고령화 지수는 특정 지역의 고령화 수준을 측정하는 중요한 지표입니다.
def calculate_aging_index(data):
young = data[data['age_group'] <= 14]['population'].sum()
old = data[data['age_group'] >= 65]['population'].sum()
return (old / young) * 100
aging_by_region = pop_df.groupby('region').apply(calculate_aging_index)
plt.figure(figsize=(12, 6))
aging_by_region.sort_values().plot(kind='bar')
plt.title('지역별 고령화 지수')
plt.xlabel('지역')
plt.ylabel('고령화 지수')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
결론
위의 데이터 분석 사례는 코로나19 확산 패턴, 주식 시장의 변동성, 인구구조 변화를 이해하는 데 중요한 역할을 합니다. 데이터 시각화를 통해 주요 패턴을 도출하고 정책 및 투자 의사결정에 활용할 수 있습니다. 앞으로도 다양한 데이터를 활용한 심층 분석이 필요하며, 지속적인 연구와 데이터 모니터링이 중요합니다.
'Comfy UI 연구실' 카테고리의 다른 글
다중 의상 학습부터 최적화까지 (0) | 2025.02.26 |
---|---|
LoRA 트레이닝 초보자를 위한 필수 가이드 (0) | 2025.02.24 |
CFG와 샘플러 (0) | 2025.02.07 |
쉽게 풀어보는 ComfyUI와 VAE의 세계 (0) | 2025.02.05 |
확장성과 양자화를 통한 최신 AI 모델 최적화 기술 (0) | 2025.01.10 |