파이썬 정리
-
결정문제와 비결정문제파이썬 정리/자료구조와 알고리즘 2024. 5. 16. 13:05
Deterministic - 결정문제 계산 이론의 어떤 형식 체계에서 예-아니오 답이 있는 질문을 말한다.일반적으로 모든 문제는 결정 문제로 환원될 수 있다고 정의하며, 이러한 결정 문제를 해결하는 절차를 정의한 것을 알고리즘이라고 한다. 어떤 결정 문제를 해결하는 알고리즘이 있으면 '결정 가능하다' 라고 말하며, 알고리즘이 없으면 '결정 불가능하다' 라고 한다. 이를 컴퓨터 알고리즘의 정의를 바탕으로 말하면"모든 입력값 n에 대해 유한 시간 내에 컴퓨터로 정확한 결과를 출력하는 알고리즘이 있으면 그 문제는 해결되었다."과 같이 말할 수 있다. 유한 시간 : 알고리즘 성능 상의 '다항 시간 성능' 알고리즘=> 자료구조 문제, 데이터 탐색 문제, 데이터 정렬 문제만이 다항 시간 성능 컴퓨터 알고리즘이..
-
파이썬 - 데이터 전처리/시각화 2파이썬 정리/데이터 전처리, 시각화 툴 2024. 5. 9. 17:35
Line 연속형 데이터시계열에 따른 데이터 변화 및 추이 시각화import seaborn as snsdata = sns.load_dataset('flights')df = data[['year','passengers']].groupby('year').sum().reset_index()plt.plot(df['year'],df['passengers'])plt.show() Bar막대그래프 범주형 데이터각각의 막대로 크기를 비교하는 것이 효과적ex)카테고리 별 값 크기 시각적 비교 plt.bar(x,y)... Historgram연속적인 데이더의 분포 , 데이터의 빈도를 시각화 해서 특정 정보를 얻고자 할 때 유용하게 사용 plt.hist(data, bins=30) # 구간들의 범위plt.xlabel('..
-
파이썬 - 데이터 전처리/시각화파이썬 정리/데이터 전처리, 시각화 툴 2024. 5. 9. 12:23
전처리 및 시각화 - 설득 : 데이터 전달의 목적성과 효과성 정의 : 무엇을 위해 ~이런 형태의 데이터가 필요하다이유 : 복잡 다양 데이터를 다루다가 전처리 로직에 매몰되어 큰 그림을 잊는 경우 발생결론 : 정의 활용 - 올바른 의사결정을 위한 사전 설계 습관 ---내가 원하는 데이터를 보기 위한 데이터 전처리 정형 데이터 속 불규칙한 데이터ex) 성별 : 남 or 여 +남성 + 여자 +여성 등 의 다양한 경우의 수 핸드폰 번호 '-'붙였다가 뗏다가 띄워쓰거나 다양.=>데이터 전달의 목적성에 따른 처리, 효과성을 가짐 excel vs pandas판다스의 장점1. 자동화와 프로그래밍 기능2. 대용량 데이터 처리3. 복잡한 데이터 처리 분석4. 확장성과 유연성5. 버젼 관리 Index더보..
-
파이썬 - Pandas - 타이타닉 분석파이썬 정리/Module 2024. 5. 7. 11:14
import pandas as pd df = pd.read_csv('C:/Users/demon/Documents/train.csv')df['Age']pd.isnull(df['Age'])df['Age'].fillna(0) # pd.isnull() == falsedf['Age'].sum()/len(df['Age'].index)#df['Age'].axes[0] for row , axes[1] for columnseries.fillna(0) : NaN값을 0로 바꿈 import pandas as pd df = pd.read_csv('C:/Users/demon/Documents/train.csv')ctFc = df.apply(lambda x : True if x['Sex'] == 'female' and x['Su..
-
알고리즘 성능파이썬 정리/자료구조와 알고리즘 2024. 5. 7. 10:55
컴퓨터 알고리즘 성능 알고리즘의 일반적인 정의 문제를 해결하기 위한 절차를 공식화한 형태로 표현한 것. 컴퓨터 알고리즘의 요건입출력0개 이상의 외부 입력과 1개 이상의 출력이 필요하다.a =3 a = int(input())b = 4 b = int(input())c = a+b c = a+bprint(c) print(c) 프로그램의 결과가 출력문이 프린트 문을 수행한 것은 아니다. 더하기 문제에 대한 결과를 출력한 것은 c변수에 더하기 연산을 한 결과를 저장하는 것이다. 이때 프린트 명령문은 컴퓨터가 제대로 수행하였는지의 결과를 직접 확인하고자 하는 명령문이지 프로그램에 전혀 영향을 미치는 것은 아니다.=> 컴퓨터 알고리즘에서 입력과 출력은 외부 입출력이 아닌 겨로가를 얻기 ..
-
푸바오 - Series to dict, list파이썬 정리 2024. 5. 2. 22:29
import pandas as pddf = pd.read_csv('C:/Users/demon/Documents/train.csv')#dict 만드는 법#1k = []Dict_P = {}for i, row in df['Pclass'].value_counts(dropna = False).sort_index().items() : Dict_P[i] = row print(Dict_P)#2print(df['Pclass'].value_counts(dropna = False).sort_index().to_dict())#3P_c = dict(df['Pclass'].value_counts(dropna = False).sort_index())print(P_c)#list 만드는 법#1for i, row in df['P..
-
Tree, Graph파이썬 정리/자료구조와 알고리즘 2024. 5. 2. 15:15
그래프(Graph)다리건너기 문제 : 정점과 간선 모음들의 결합정점의 집합 V, 간선의 집합 E // 그래프 = G = (V,E)인접 : 간선으로 연결 된 두 정점/''''- B -- , E A / |\....- C ' - - D이 그?림에 따르면 정점 A에서 E까지는 ABE 와 ACE의 두 개의 경로를 이루고 있다. 그래프 내 모든 정점이 모두 연결되어 있으면 그래프가 연결되었다고 말한다. 연결된 그래프 내의 모든 정점은 하나 이상의 간선를 가지며 차수는 정점에 속한 간선들의 수를 말한다.A,B,D 는 2개의 간선을 가지므로 차수는 2이고, 정점 E,C는 간선의 수가 3개이므로 차수는 3이다. 그래프는 무방향 / 방향 그래프로 나뉘며이에 관한 예를 들자면 위의 그래프는 무방향 그래프로 (A..
-
Stack, Queue파이썬 정리/자료구조와 알고리즘 2024. 5. 1. 14:19
문제 해결의 알고리즘데이터 저장의 자료구조 병렬 - or직렬 - andnot회로 : True/ false 반대로 (0,1) 전류의 흐름, 오른쪽 전달상태 저장=> 되먹임 회로: not, not연속 회로 사용을 통해 흐름 내에서 데이터 저장 가능 이에 따른 래치 회로 / 플리플롭 회로 존재 (이해를 위해 탐구 필요)=>메모리 내 byte방식으로 저장되는 방법 C 언어 기반 언어들 -> 최종적으로는 배열, 연결리스트 형식으로 메모리에 저장됨기본 : array, linked list+선형 : stack, queue +비선형 : tree, graph = 기본 자료구조에 특정 규칙 포함한 자료구조 추상적 구조 : 기본 자료에 추상적으로 특정한 규칙 포함선형구조 : 순서가 정해져있는 자료구조저장된 여러 개의 데..