Web crawling e analisi semantica per il supporto all’identificazione di video sharing pirati

Web crawling e analisi semantica per il supporto all’identificazione di video sharing pirati

Lo scopo principale degli algoritmi di web crawling e web scraping, è quello di raccogliere i dati non strutturati all’interno del web e gestirli in modo da potersi adattare al maggior numero di scenari possibili. Tramite questa tesi si vuol creare un algoritmo in grado di analizzare siti web (partendo da un blacklist, fino a youtube) utilizzarne il contenuto partendo dai metadata presenti all’interno dei video condivisi e analizzarli tramite tecniche di AI e ML.

Argomento principale:

IT/Automation – Web Crawling, Semantic crawler, Web Scraping, Machine Learning

Corso di studio e requisiti candidato:

Informatica, Ingegneria informatica

Sede tirocinio: Napoli e Milano

Candidati per questa offerta

Allowed Type(s): .pdf, .doc, .docx