multiprocessing: map vs map_async

Wat is het verschil tussen het gebruik van mapen map_async? Voeren ze niet dezelfde functie uit nadat ze de items uit de lijst naar 4 processen hebben gedistribueerd?

Dus is het verkeerd om aan te nemen dat beide asynchroon en parallel lopen?

def f(x):
   return 2*x
p=Pool(4)
l=[1,2,3,4]
out1=p.map(f,l)
#vs
out2=p.map_async(f,l)

Antwoord 1, autoriteit 100%

Er zijn vier keuzes om taken aan processen toe te wijzen. U moet rekening houden met multi-args, gelijktijdigheid, blokkeren en bestellen. mapen map_asyncverschillen alleen wat betreft blokkering. map_asyncblokkeert niet terwijl mapblokkeert

Dus laten we zeggen dat je een functie had

from multiprocessing import Pool
import time
def f(x):
    print x*x
if __name__ == '__main__':
    pool = Pool(processes=4)
    pool.map(f, range(10))
    r = pool.map_async(f, range(10))
    # DO STUFF
    print 'HERE'
    print 'MORE'
    r.wait()
    print 'DONE'

Voorbeelduitvoer:

0
1
9
4
16
25
36
49
64
81
0
HERE
1
4
MORE
16
25
36
9
49
64
81
DONE

pool.map(f, range(10))wacht tot alle 10 functieaanroepen zijn voltooid, zodat we alle afdrukken op een rij zien.
r = pool.map_async(f, range(10))zal ze asynchroon uitvoeren en alleen blokkeren wanneer r.wait()wordt aangeroepen, dus we zien HEREen MOREertussen maar DONEstaat altijd aan het einde.

Other episodes