본문 바로가기

데이터 분석2

[데이터 분석] Joblib 라이브러리 ㅇJoblib 라이브러리: Python에서 데이터 직렬화, 병렬처리 및 메모리 효율적인 데이터 처리에 사용되는 라이브러리주로 머신러닝이나 데이터 과학 작업에서 모델을 저장하거나 대규모 데이터를 처리할 때 유용하게 사용된다. joblib은 표준 라이브러리인 pickle과 유사하지만 더 빠르고 효율적으로 동작한다는 장점이 있다.  [joblib의 주요 기능]1. 데이터 직렬화와 역직렬화를 통한 모델 저장과 불러오기2. 메모리 캐싱을 통한 계산 최적화3. 병렬 처리를 통한 성능 향상  [데이터 직렬화와 역직렬화]joblib의 dump() 와 load() 함수는 데이터나 머신러닝 모델을 파일로 저장하고 불러올 때 사용된다. 이 기능은 학습된 모델을 나중에 재사용하거나 공유할 때 매우 유용하다. 예를 들어 sci.. 2024. 12. 17.
[데이터 분석] Pandas 라이브러리 ㅇPandas 라이브러리: Python 에서 데이터 분석과 조작을 위해 널리 사용되는 오픈소스 라이브러리효율적인 데이터 구조와 풍부한 기능을 제공하여 다양한 데이터 작업을 간단하게 수행할 수 있도록 도와준다. 주로 Series와 DataFrame이라는 두 가지 주요 데이터 구조를 사용하며, 데이터 처리 속도를 크게 향상시키는 것이 특징이다.  [Pandas의 주요 데이터 구조 2가지]1. Series: 1차원 배열로, 인덱스를 포함하는 데이터 구조리스트나 딕셔너리를 기반으로 생성할 수 있으며, 데이터와 인덱스를 함께 저장한다import pandas as pd# 리스트를 기반으로 Series 생성data = [10, 20, 30]series = pd.Series(data, index=['A', 'B', '.. 2024. 12. 15.