Talisman je objedinjeni skup alata koji automatizuju tipične zadatke obrade podataka, kao što su pronalaženje podataka, integracija, analiza, skladištenje i vizuelizacija. Omogućava brz razvoj specijalizovanih višekorisničkih analitičkih sistema koji se spajaju i rade jednoobrazno sa podacima iz privatnih baza podataka i internet izvora (uključujući društvene mreže).
Karakteristike i prednosti
Talisman objedinjuje alate neophodne za velike podatke. Gradi se na dve ISP RAS tehnologije: Dedoc, sistem za pronalaženje strukture dokumenta, i Tekterra, platforma za izdvajanje semantike iz teksta. Talisman je uporediv sa najboljim svetskim konkurentima (Palantir Gotham i IBM Vatson Content Analitics). Njegova prednost je automatizacija procesa rutinske analize sa najnovijim rezultatima istraživanja (smanjenje resursa potrebnih za ručnu analizu).
Talisman obezbeđuje:
Bogat skup komponenti za višekratnu upotrebu koje imaju API-je za jednostavno upravljanje i integraciju:
Komponente za pronalaženje podataka. Oni uključuju okvir za prikupljanje podataka na Internetu, naime, sa društvenih medija (Facebook, VKontakte, Tvitter, Instragram, Odnoklassniki, Ioutube, LinkedIn itd.), blogova, vesti, MediaViki sajtova, portala za programere itd. Takođe postoji sistem za uvoz podataka iz skladišta datoteka i baza podataka.
Komponente automatske analize podataka. Alati za analizu su dizajnirani kao Docker kontejneri kojima se upravlja preko API-ja sistema Talisman.Flov (uključen u Jedinstveni registar ruskih programa pod brojem 6045). Izlaz se čuva na hard diskovima ili u bazama podataka (PostgreSKL, ElasticSearch, Cassandra itd.). Osnovni servisi koji se koriste su Tesseract OCR sistem i sopstveni ISP RAS alati.
Komponente skladištenja i indeksiranja. To uključuje brojne baze podataka i pretraživače informacija koji čuvaju izvorne podatke, rezultate automatske analize i rezultate ručnog rada korisnika.
Veb interfejs jednostavan za korišćenje koji objedinjuje sve komponente koje zahtevaju interakciju korisnika.
Fleksibilna modularna arhitektura koja omogućava dodavanje novih funkcija zanimljivim komponentama bez promene drugih.
Skalabilna arhitektura koja omogućava obradu i skladištenje više podataka samo dodavanjem više hardvera bez ikakvih promena softvera.
Specijalizovane komponente koje nadgledaju status sistema, upravljaju evidencijom događaja, izvršavaju primenu, autentifikaciju i autorizaciju, kontrolu pristupa i jednosmerni prenos podataka.
Alati i metode za obuku modela mašinskog učenja kao i za prenošenje postojećih algoritama u druge domene znanja.
Konfigurabilna šema domena znanja koju korisnik može promeniti kada sistem radi.
Opcija implementacije na licu mesta koristeći postojeći hardver korisnika ili novi hardver koji je obezbeđen i konfigurisan sa okvirom.
Integracija sa sistemima privatnih korisnika preko obezbeđenih komponentnih API-ja.
Zatvorena licenca besplatno. Talisman je zasnovan na alatima otvorenog koda i znanja ISP RAS.
Oblasti primene Talismana
Automatizovana konstrukcija baze znanja za dati domen znanja i neprekidno praćenje novih informacija u vezi sa objektima od interesa.
Inteligencija konkurenata zasnovana na otvorenim izvorima (OSINT).
Otkrivanje informativnih kampanja koje imaju za cilj da manipulišu ciljnom publikom, kao i otkrivanje ciljne publike za kampanju.
Otkrivanje i analiza sredstava za širenje informacija (korišćeni resursi, ljudi, botovi) kao i analiza komunikacijskih uloga članova zajednice (izvor vesti, vođa mišljenja, diseminator, moderator, bot, komentator).
Upravljanje reputacijom za osobe i kompanije, uključujući praćenje relevantnih vesti, otkrivanje mogućih žalbi, praćenje curenja informacija i otkrivanje informacija.
Optimizacija upravljanja osobljem uključujući efikasno regrutovanje, verifikaciju podataka, otkrivanje skrivenih aktivnosti, pomoć u razvoju motivacionih sistema.
Objektivno vrednovanje efikasnosti aktivnosti i testiranje strategija na ciljnoj publici radi prikupljanja povratnih informacija.
Pronalaženje i upravljanje društvenim tenzijama za otkrivanje i sprečavanje eskalacije sukoba.