← Bloga Dön

Veri Biliminde JSON: Python ve Pandas Kılavuzu

Veri bilimi iş akışlarında JSON kullanımı. Python ve Pandas ile JSON verilerini işlemeyi ve analiz etmeyi öğrenin.

Big JSON Team13 dk okumaprogramlama
B

Big JSON Team

Technical Writer

Expert in JSON data manipulation, API development, and web technologies. Passionate about creating tools that make developers' lives easier.

13 min read

# Veri Biliminde JSON Kullanımı

Veri bilimi dünyasında veri genellikle Excel veya CSV olarak görülse de, API'lerden gelen verilerin büyük çoğunluğu JSON formatındadır. Bu verileri işlemek veri bilimcileri için temel bir yetenektir.

---

Pandas ile JSON Okuma

Python'daki Pandas kütüphanesi, JSON verilerini saniyeler içinde bir tabloya (DataFrame) dönüştürebilir:

import pandas as pd

# JSON dosyasını oku

df = pd.read_json('veriler.json')

# İlk 5 satırı göster

print(df.head())

---

İç İçe Geçmiş Verileri Düzleştirme (Normalization)

JSON verileri genellikle "nested" (iç içe) yapıdadır. Pandas içindeki json_normalize fonksiyonu bu yapıları düz bir tablo haline getirir:

from pandas import json_normalize

veri = { "kullanici": { "id": 1, "profil": { "ad": "Ece" } } }

df = json_normalize(veri)

# Sonuç: kullanici.profil.ad sütunu oluşur

---

JSONL (JSON Lines) Formatı

Devasa veri setlerinde (Big Data), tüm dosyayı belleğe yüklemek imkansız olabilir. Bu durumda her satırı bağımsız bir JSON nesnesi olan .jsonl dosyaları kullanılır. Pandas bunu da destekler:

df = pd.read_json('buyuk_veri.jsonl', lines=True)

Sonuç

JSON, veri bilimi ekosisteminin vazgeçilmez bir parçasıdır. Python ve Pandas kütüphaneleriyle bu esnek formatı güçlü analiz tablolarına dönüştürebilirsiniz. Büyük dosyalarda yapıyı hızlıca incelemek için Big JSON Viewer mükemmel bir yardımcıdır.

Share:

İlgili Makaleler

Read in English