Ќе презентираме прототип апликација "агрегатор на новости" кој работи со неколку странски медиуми. Целта на презентацијата е вовед во основните концепти на машинско учење од кои може да произлезат разни идеи за правење интересни апликации. Во прототип имплементацијата (кодот може да го видите тука) ќе разгледаме неколку компоненти:
- поставување тренинг податоци
- собирање новости од неколку медиуми
- парсирање на RSS/HTML текстови
- класификација со статистичка метода
- креирање кластер со статистичка метода
Алатки преку кои ќе бидат разгледани концептите:
- Програмски јазик: Ruby 1.9.2
- Стандардни библиотеки: open-uri, net/http, rss (rss/2.0), json
- Други библиотеки: Sintara, Redis, Haml, Sass, Nokogiri
- База на податоци: Redis
Цел на презентацијата:
- агрегатор на новости како концепт и реализација
- краток вовед во користените алатки со акцент на Redis и во какви сценарија може да се користи
- дискусија на други алгоритми за класификација и кластерификација на текстови (Bayes, Latent Semantic Analysis, K-means
- дискусија на архитектура за поголеми апликациии од овој тип (couchdb/mongodb, парсирање и анализа на македонски текстови)
- разгледување идеи за апликации од овој вид во Македонија
Кликнете тука за поголема мапа.
No comments:
Post a Comment
Note: Only a member of this blog may post a comment.