Outils logiciels pour les cours Paris II

Cours Paris II

edit SideBar

BD 4

Main.BD4 History

Hide minor edits - Show changes to markup

October 24, 2018, at 10:35 PM by 82.229.146.181 -
Changed lines 72-73 from:

[[http://mdr.free.fr/td/reservoir2a.py | Code Réservoir lisant dt_b.csv]

to:

Code Réservoir lisant dt_b.csv

October 24, 2018, at 10:35 PM by 82.229.146.181 -
Added lines 70-73:

[[http://mdr.free.fr/td/reservoir2a.py | Code Réservoir lisant dt_b.csv] Fichier dt_b.csv

October 24, 2018, at 09:04 PM by 82.229.146.181 -
Changed line 3 from:
  • Peut-on garder peu de données, parmi celles qui sont lues sur un flux de données?
to:
  • Peut-on garder peu de données, parmi celles qui sont lues dans un flux de données?
October 24, 2018, at 08:10 PM by 82.229.146.181 -
Changed lines 30-31 from:

import random

to:
 import random
Changed line 34 from:
 .......
to:
 .......à définir pour lire un fichier
October 24, 2018, at 08:09 PM by 82.229.146.181 -
Changed line 32 from:

import csv

to:
 import csv
Changed lines 37-38 from:

edge_list = read_edge_from_file(file_input)

to:
 edge_list = read_edge_from_file(file_input)
Changed lines 41-42 from:

m=[0]

to:
 m=[0]
Changed lines 45-50 from:

i=0

sample = []

for index, edge in enumerate(edge_list):

to:
 i=0

 sample = []

 for index, edge in enumerate(edge_list):
Changed line 68 from:

print(sample)

to:
 print(sample)
October 24, 2018, at 08:08 PM by 82.229.146.181 -
Added lines 27-68:
  • Programme Python qui implémente le Réservoir sampling (k= taille du Réservoir)

import random

import csv

 .......

edge_list = read_edge_from_file(file_input)

 #m stores the number of edges in windows. m[0] is the number of edges in the first window

m=[0]

 #i is the index of the windows: 0,1,2,...

i=0

sample = []

for index, edge in enumerate(edge_list):

    m[i] += 1

    if index < k:

        sample.append(edge)

    else:

        j = random.randint(0, index)

        if j < k:

           del sample[j]

           sample.append(edge)

print(sample)

October 24, 2018, at 07:55 PM by 82.229.146.181 -
Changed line 3 from:
  • Peut-on garder peu de données, parmi celles qui sont lues sur un flux?
to:
  • Peut-on garder peu de données, parmi celles qui sont lues sur un flux de données?
October 24, 2018, at 07:53 PM by 82.229.146.181 -
Changed lines 10-11 from:
  • Flux d'arêtes: (a,b), (b,c), (c,d), (a,c)......
to:
  • Exemple 2: Flux d'arêtes: (a,b), (b,c), (c,d), (a,c)......
Added lines 21-26:
  • Flux Twitter sur des mots clés
    • Visualisation Gephi
    • Flux de mégadonnées
October 24, 2018, at 07:52 PM by 82.229.146.181 -
Changed lines 3-6 from:
  • Peut-on garder peu de données?
  • Flux de valeurs: 1, 3, 6, 45, 3, 1, 3, 7, 3, .....
to:
  • Peut-on garder peu de données, parmi celles qui sont lues sur un flux?
  • Exemple 1: Flux de valeurs: 1, 3, 6, 45, 3, 1, 3, 7, 3, .....
Changed lines 14-20 from:
  • Il y a-t-il un gros cluster?
to:
  • Il y a-t-il des clusters?
  • Réservoir sampling: toutes les arêtes ont la même probabilité d'étre dans le Réservoir.
  • Window Réservoir: données dynamiques
  • Graphes aléatoires: émergence de la composante géante.
October 03, 2018, at 03:18 PM by 82.229.146.181 -
Changed lines 1-15 from:

aa

to:

Streaming

  • Peut-on garder peu de données?
  • Flux de valeurs: 1, 3, 6, 45, 3, 1, 3, 7, 3, .....
    • Nombre de valeurs distinctes? F0 = 5
  • Flux d'arêtes: (a,b), (b,c), (c,d), (a,c)......
    • Le graphe est-il connexe?
    • Il y a-t-il un gros cluster?
October 03, 2018, at 03:10 PM by 82.229.146.181 -
Added line 1:

aa

UP2