전체 글 26

[빅데이터 분석기사 실기] 판다스 기본 함수 (1)

1. 라이브러리 불러오기 import pandas as pdimport numpy as np  2. csv 파일 불러와서 df라는 변수로 저장하기df=pd.read_csv('cafe_menu.csv')*csv = comma seperated values   3. 시리즈 만들기 menu=pd.Series(['아아','아라','바라'])price=pd.Series([1000,2000,3000])   4. 데이터 프레임 만들기menu=pd.DataFrame({        "menu": menu,        "price": price}) menu=pd.DataFrame({        "menu": ['아아','아라','바라'],        "price": [1000,2000,3000]})  5. 데이터 ..

카테고리 없음 2024.05.10

데이터 사이언티스트/데이터 애널리스트/비즈니스 애널리스트/데이터 엔지니어링 비교, 차이점

1. Data Scientist 필수 : 머신러닝(ML), 데이터마이닝, SQL, 프로그래밍(Python>R), 통계지식 권장 : DBMS, Hadoop, ETL, 데이터파이프라인, Power BI, 태블로 2. Data Analyst 필수 : Google/Adobe Analytics, SQL, 통계, BI 툴 가끔 : 머신러닝, 프로그래밍(Python>R) ↑ 3. Business Analyst 필수 : BI 툴, SQL, Adobe/Google Analytics * Business Analytics 학과 : 엔지니어링보다 비전공자 대상 데이터 분석에 입문시키는 것. 이 학과를 나오면 본인이 열심히 노력하면 데이터사이언티스트까지 가능함. 4. Data Engineering DS, DA, BA가 분석을 ..

IT 와 DT 2023.01.20

Database Lock 데이터베이스 락

1. 데이터베이스에 잠금(lock)이 왜 필요할까? - 동시성 제어 : 트랜잭션들이 동시에 수행될 때, 일관성을 해치지 않도록 데이터 접근을 제어하는 DBMS의 기능 2. Lock의 종류 - 낙관적, 비관적 잠금 - 낙관적 잠금 (Optimisstic Lock) : 동시 업데이트가 거의 없는 경우 한 사용자가 업데이트를 완료하면, 동시 업데이트 확약을 시도하는 다른 사용자들에게 충돌이 있음을 알림. 충돌 발생시 나중에 시도하는 사용자 rollback. - 비관적 잠금 (Pessimistic Lock) : 동시 업데이트가 빈번한 경우, 외부 시스템과 연동한 경우 다른 사용자는 먼저 시도한 사용자가 변경을 확약해서 레코드 잠금을 릴리스할 때까지 대기해야 함 3. Lock 연산의 종류 1) Shared loc..

[업무관련 책 #1] 비전공자를 위한 이해할 수 있는 IT 지식

옆자리 동현대리님이 빌려주신 책 ㅎㅎ 업무하면서 접하는 어렴풋 알지만 제대로 알지 못하는 용어와 상식 수준의 지식을쉽게 설명해준다. REST API, 네트워크와 서버, 우분투, 레드햇 등등. 정처기 유튜브나 수험서를 볼게 아니라 이런 책 읽는 게 백만배 더 도움되는 듯! 나처럼 IT 문외한이 관련 업무를 보게 됐을 때 입문서로 추천 😊 제 3장 네트워크, 클라이언트, 서버 컴퓨터가 연결되면 (=네트워크가 연결되면) 연결된 컴퓨터끼리 파일도 주고받고, 게임도 함께 할 수 있고 할 수 있는 게 많음. 컴퓨터가 연결된 작은 지역을 LAN (Local Area Network) 라고 표현함. 여러 LAN을 하나로 연결해 MAN (Metropolitan Area Network) 도시와 도시, 나라와 나라를 모두 연..

IT 와 DT/책 2022.09.26

[헷갈리는 문법/어휘] be subject to vs. be subjected to / focus on vs. be focused on

1. be subject to vs. be subjected to 차이가 미묘하고, 어떤 경우에는 둘 다 맞기도 함. 1) A be subject to B : A는 B의 대상이다. A는 B의 영향을 받는다. A는 B의 지배를 받는다 A는 B하기 쉽다. 이때의 subject는 형용사라고 할 수 있음 All flights are subject to delay 모든 비행편들은 연착의 대상이다 = 연착될 수 있다 Prices are subject to change 가격은 변화의 대상이다 = 변할 수 있다 The promotion is subject to our terms and conditions. 승진은 우리 팀의 계약 조건에 달려 있다 2) A be subjected to B : ~를 당하다 이때의 subj..

English 2022.09.19

[파이썬 Python] PDF에서 text 추출해 txt파일 저장하기

매달 올려야 할 인보이스 결재를 편하게 하고자 파이썬을 두드려봅니다 (●'◡'●) → STEP1 PDF에서 text 추출해 txt 파일로 저장 STEP2 txt 파일에서 필요한 부분 엑셀 특정 행/열에 저장 오늘은 STEP1만 챱챱 우선!! cmd에서 pip install PyPDF2하고 시작 from PyPDF2 import PdfFileReader, PdfFileWriter file_path = '파일이름.pdf' pdf = PdfFileReader(file_path) with open('파일이름.txt', 'w') as f: for page_num in range(pdf.numPages): # print('Page: {0}'.format(page_num)) pageObj = pdf.getPage(p..

OSI 7 계층 (OSI 7 Layer)

OSI (Open Systems Interconnection Reference Model) ○ 국제표준화기구(ISO)에서 개발한 모델로, 네트워크 프로토콜이 통신하는 구조를 7개의 계층으로 나눈 것 ○ 왜 나누었나? 통신이 이루어지는 과정을 단계별로 파악할 수 있기 때문. 흐름을 한 눈에 알아보기 쉽고, 사람들이 이해하기 쉽고, 7단계 중 특정한 곳에 이상이 생기면 다른 단계의 장비 및 소프트웨어를 건들지 않고도 문제가 발생한 계층만 고치면 되기 때문 It is because of the fact that it will be easy for troubleshooting the network problems. Only the layer in which the problem exist will be in m..

정관사 the, 부정관사 a/an 사용하는 경우

정관사 The 사용하는 경우 쓰임 EXAMPLEdS 최상급 앞 The first, the last, the second, the sixth… 서수 앞 The best, the most famous, the cutest… 하나 밖에 없는 것들 앞 The moon, the world, the society, the world, the universe, the Internet, the stars… 물리적 환경을 나타내는 명사 앞 The earth, the sea, the sky, the wind, the rain, the country… 수량 표현 + of + the + 명사 Most of the, some of the, a few of the, all of the, many of the Most of the..

English 2022.09.12