python sorteer lijst van json op waarde

April 27, 2022

Ik heb een bestand dat bestaat uit JSON, elk een regel, en ik wil het bestand sorteren op update_time omgekeerd.

voorbeeld JSON-bestand:

{ "page": { "url": "url1", "update_time": "1415387875"}, "other_key": {} }
{ "page": { "url": "url2", "update_time": "1415381963"}, "other_key": {} }
{ "page": { "url": "url3", "update_time": "1415384938"}, "other_key": {} }

wil uitvoer:

{ "page": { "url": "url1", "update_time": "1415387875"}, "other_key": {} }
{ "page": { "url": "url3", "update_time": "1415384938"}, "other_key": {} }
{ "page": { "url": "url2", "update_time": "1415381963"}, "other_key": {} }

mijn code:

#!/bin/env python
#coding: utf8
import sys
import os
import json
import operator
#load json from file
lines = []
while True:
    line = sys.stdin.readline()
    if not line: break
    line = line.strip()
    json_obj = json.loads(line)
    lines.append(json_obj)
#sort json
lines = sorted(lines, key=lambda k: k['page']['update_time'], reverse=True)
#output result
for line in lines:
    print line

De code werkt prima met het voorbeeld-JSON-bestand, maar als een JSON geen ‘update_time’ heeft, wordt de KeyError-uitzondering gegenereerd. Zijn er niet-uitzonderlijke manieren om dit te doen?

Antwoord 1, autoriteit 100%

Schrijf een functie die try...exceptgebruikt om de KeyErroraf te handelen, gebruik dit dan als het argument keyin plaats van je lambda .

def extract_time(json):
    try:
        # Also convert to int since update_time will be string.  When comparing
        # strings, "10" is smaller than "2".
        return int(json['page']['update_time'])
    except KeyError:
        return 0
# lines.sort() is more efficient than lines = lines.sorted()
lines.sort(key=extract_time, reverse=True)

Antwoord 2, autoriteit 67%

U kunt dict.get()gebruiken met een standaardwaarde:

lines = sorted(lines, key=lambda k: k['page'].get('update_time', 0), reverse=True)

Voorbeeld:

>>> lines = [
...     {"page": {"url": "url1", "update_time": "1415387875"}, "other_key": {}},
...     {"page": {"url": "url2", "update_time": "1415381963"}, "other_key": {}},
...     {"page": {"url": "url3", "update_time": "1415384938"}, "other_key": {}},
...     {"page": {"url": "url4"}, "other_key": {}},
...     {"page": {"url": "url5"}, "other_key": {}}
... ]
>>> lines = sorted(lines, key=lambda k: k['page'].get('update_time', 0), reverse=True)
>>> for line in lines:
...     print line
... 
{'other_key': {}, 'page': {'url': 'url1', 'update_time': '1415387875'}}
{'other_key': {}, 'page': {'url': 'url3', 'update_time': '1415384938'}}
{'other_key': {}, 'page': {'url': 'url2', 'update_time': '1415381963'}}
{'other_key': {}, 'page': {'url': 'url4'}}
{'other_key': {}, 'page': {'url': 'url5'}}

Ik zou echter nog steeds het EAFP-principevolgen dat Ferdinand stelde voor – op deze manier zou je ook gevallen behandelen waarin de page-sleutel ook ontbreekt. Veel gemakkelijker om het te laten mislukken en af te handelen dan het controleren van allerlei hoekgevallen.

Antwoord 3, autoriteit 37%

# sort json
lines = sorted(lines, key=lambda k: k['page'].get('update_time', 0), reverse=True)

Antwoord 4, autoriteit 7%

def get_sortest_key(a: dict, o: dict):
    v = None
    k = None
    for key, value in a.items():
        if v is None:
            v = value
            k = key
            continue
        if v > value:
            v = value
            k = key
    o.update({k: v})
    a.pop(k)
    if a:
        get_sortest_key(a, o)
    else:
        return
def call(o):
    a = {'a': 9, 'b': 1, 'c': 3, 'k': 3, 'l': -1, 's': 100}
    z = get_sortest_key(a, o)
    print(o)
o={}    
call(o)

Previous articleToetsenbord verbergen bij het navigeren van een fragment naar een ander

Next articleMeerdere overerving in python3 met verschillende handtekeningen

python sorteer lijst van json op waarde

Antwoord 1, autoriteit 100%

Antwoord 2, autoriteit 67%

Antwoord 3, autoriteit 37%

Antwoord 4, autoriteit 7%

Other episodes

Verschillen tussen numpy.random.rand en numpy.random.randn in Python

Bewerken van specifieke regel in tekstbestand in Python

Single Sign On (SSO) implementeren met Django

hoe sorteer ik op lengte van string gevolgd door alfabetische volgorde?

LabelEncoder: TypeError: ‘>’ niet ondersteund tussen instanties van ‘float’ en ‘str’

Lxml-module installeren in python

`staticmethod` en `abc.abstractmethod`: gaat het samensmelten?