본문 바로가기

전체 글64

[파이썬 코딩] 데이터프레임 하나의 컬럼을 여러 개로 나누기 데이터 프레임 내 하나의 컬럼값을 두 개의 컬럼값으로 나눠보겠습니다.. 그래서 어떻게 나눈다는 거지? 이해가 잘 안 가시는 분들은 아래 그림을 봐주세요. 아래처럼 도로명_주소명 컬럼을 주시도명과 시군구명으로 나눠보려는 것입니다. import pandas as pd df = pd.read_csv('/content/데이터.csv') df.head() 나누기 위해 쓸 명령어는 바로 split 명령어인데요. 아래와 같이 split(' ')을 준다는 것은 ' ' (공백)을 기준으로 안의 데이터를 쪼갠다는 겁니다. 아래의 아웃풋 결과를 보시는 것처럼 리스트 단위 내로 쪼개진 것을 확인하실 수 있습니다. df['도로명_주소'].str.split(' ') 쪼개진 데이터에서 1행당 똑같은 위치에 있는 데이터를 가져오는 .. 2024. 2. 12.
코딩이 필요없는 데이터 시각화 툴 5가지 모음 # 소개하기에 앞서 데이터 분석 경험이 있는 사람들이라면 데이터 시각화의 중요성을 모르는 사람은 거의 없을 것입니다. 단순히 수치상의 표현이나 표(테이블)로는 표현하기 힘든 부분을 시각화를 통해 나타낼 수 있으며, 이 시각화를 어떻게 표현하느냐? 에 좋은 그래프가 될 수도 있고 나쁜 그래프가 될 수도 있는 것이죠! 보통 이러한 시각화를 잘 하기 위해서 많은 분들이 코딩을 해야 한다고 생각하고 있습니다. 저 같은 경우도 현업에서 파이썬이나 R 언어를 활용한 시각화를 하고 있으며, 이미 시각화를 위한 코딩에 익숙해져 있는 것이죠! 하지만 제가 따로 코딩이 필요 없는 데이터 시각화 툴을 사용해 보고 느낀 점은 코딩을 통한 시각화보다도 툴을 통한 시각화만의 나름의 장점이 있다는 것입니다. 물론 이 장점이라는 것.. 2024. 2. 11.
[인간관계 꿀팁] 이것 하나만 알면 인간관계 갈등을 줄일 수 있습니다. 인간은 예로부터 개인이 아닌 집단을 이루며, 살아왔습니다. 원시시대의 부족사회를 시작으로 공동체 의식을 쌓기 시작하였으며, 각기 사람의 지위, 역할, 능력에 따라 공동체에 필요한 하나하나를 분담하며, 집단 사회의 발전을 이뤄왔습니다. 현대사회에서도 이런 인간관계는 피할 수 없습니다. 대한민국이라는 국가라는 큰 영역의 집단 아래에서 우리는 저마다의 역할을 통해 기여하며, 이를 통해 먹고 살 수 있는 소득을 얻을 수 있습니다. 이 공동체 사회 속에서 역할을 통해 기여한다는 것은 결국 사람들과 상호작용을 해야 합니다. 하지만 이를 생각보다 어려워하는 사람들이 많습니다. 그래서 이번 포스팅을 통해 제가 알고 있는 인간관계 꿀팁을 하나 알려드리려고 합니다. 이것이 여러분들의 인간관계 문제를 완전히 해결해주지 못할.. 2024. 2. 4.
캐글(kaggle) 데이터를 colab에서 사용할 때 꿀팁 [API 토큰] 데이터 분석 좀 해본 사람들은 오늘 얘기드릴 캐글(Kaggle) 을 모르시는 분들은 없을 거라 생각합니다. 그래도 혹시나 모르시는 분들을 위해서 설명을 드리자면 데이터 분석가가 자신의 기술을 선보일 수 있는 플랫폼을 제공할 뿐만 아니라 누구나 사용할 수 있는 수백만 개에 달하는 무료 데이터 세트를 제공합니다. 또한 캐글(Kaggle)은 데이터 분석 분야에서 많은 대회를 개최하고 우승자에게 보상을 제공합니다. 이력서에 큰 도움이 될 배지를 획득할 수도 있습니다. 캐글에서 어떻게 가져와서 어떤 툴로 활용할지는 사람마다 다릅니다. 저처럼 colab에 데이터를 가져와서 활용하시는 분들을 위해 이번 포스팅을 만들었습니다. 바로 캐글 API를 통해 csv와 같은 데이터 파일을 colab에 받아서 쓸 수 있습니다. .. 2024. 1. 16.