python sorteer lijst van json op waarde

Ik heb een bestand dat bestaat uit JSON, elk een regel, en ik wil het bestand sorteren op update_time omgekeerd.

voorbeeld JSON-bestand:

{ "page": { "url": "url1", "update_time": "1415387875"}, "other_key": {} }
{ "page": { "url": "url2", "update_time": "1415381963"}, "other_key": {} }
{ "page": { "url": "url3", "update_time": "1415384938"}, "other_key": {} }

wil uitvoer:

{ "page": { "url": "url1", "update_time": "1415387875"}, "other_key": {} }
{ "page": { "url": "url3", "update_time": "1415384938"}, "other_key": {} }
{ "page": { "url": "url2", "update_time": "1415381963"}, "other_key": {} }

mijn code:

#!/bin/env python
#coding: utf8
import sys
import os
import json
import operator
#load json from file
lines = []
while True:
    line = sys.stdin.readline()
    if not line: break
    line = line.strip()
    json_obj = json.loads(line)
    lines.append(json_obj)
#sort json
lines = sorted(lines, key=lambda k: k['page']['update_time'], reverse=True)
#output result
for line in lines:
    print line

De code werkt prima met het voorbeeld-JSON-bestand, maar als een JSON geen ‘update_time’ heeft, wordt de KeyError-uitzondering gegenereerd. Zijn er niet-uitzonderlijke manieren om dit te doen?


Antwoord 1, autoriteit 100%

Schrijf een functie die try...exceptgebruikt om de KeyErroraf te handelen, gebruik dit dan als het argument keyin plaats van je lambda .

def extract_time(json):
    try:
        # Also convert to int since update_time will be string.  When comparing
        # strings, "10" is smaller than "2".
        return int(json['page']['update_time'])
    except KeyError:
        return 0
# lines.sort() is more efficient than lines = lines.sorted()
lines.sort(key=extract_time, reverse=True)

Antwoord 2, autoriteit 67%

U kunt dict.get()gebruiken met een standaardwaarde:

lines = sorted(lines, key=lambda k: k['page'].get('update_time', 0), reverse=True)

Voorbeeld:

>>> lines = [
...     {"page": {"url": "url1", "update_time": "1415387875"}, "other_key": {}},
...     {"page": {"url": "url2", "update_time": "1415381963"}, "other_key": {}},
...     {"page": {"url": "url3", "update_time": "1415384938"}, "other_key": {}},
...     {"page": {"url": "url4"}, "other_key": {}},
...     {"page": {"url": "url5"}, "other_key": {}}
... ]
>>> lines = sorted(lines, key=lambda k: k['page'].get('update_time', 0), reverse=True)
>>> for line in lines:
...     print line
... 
{'other_key': {}, 'page': {'url': 'url1', 'update_time': '1415387875'}}
{'other_key': {}, 'page': {'url': 'url3', 'update_time': '1415384938'}}
{'other_key': {}, 'page': {'url': 'url2', 'update_time': '1415381963'}}
{'other_key': {}, 'page': {'url': 'url4'}}
{'other_key': {}, 'page': {'url': 'url5'}}

Ik zou echter nog steeds het EAFP-principevolgen dat Ferdinand stelde voor – op deze manier zou je ook gevallen behandelen waarin de page-sleutel ook ontbreekt. Veel gemakkelijker om het te laten mislukken en af ​​te handelen dan het controleren van allerlei hoekgevallen.


Antwoord 3, autoriteit 37%

# sort json
lines = sorted(lines, key=lambda k: k['page'].get('update_time', 0), reverse=True)

Antwoord 4, autoriteit 7%

def get_sortest_key(a: dict, o: dict):
    v = None
    k = None
    for key, value in a.items():
        if v is None:
            v = value
            k = key
            continue
        if v > value:
            v = value
            k = key
    o.update({k: v})
    a.pop(k)
    if a:
        get_sortest_key(a, o)
    else:
        return
def call(o):
    a = {'a': 9, 'b': 1, 'c': 3, 'k': 3, 'l': -1, 's': 100}
    z = get_sortest_key(a, o)
    print(o)
o={}    
call(o)

Other episodes