Програмски јазици: Машинско учење во Ruby (01.12.2011, 19 час)

Првата епизода на "Програмски јазици" во Хаклаб 2.0 ја отвараме со ruby.mk состанок во стандардниот термин: Четврток, 19-21 часот. Ова е прв ruby состанок по пауза од неколку месеци, последниот беше во рамките на "Едно лето" проектот кон крајот на летото.

Ќе презентираме прототип апликација "агрегатор на новости" кој работи со неколку странски медиуми. Целта на презентацијата е вовед во основните концепти на машинско учење од кои може да произлезат разни идеи за правење интересни апликации. Во прототип имплементацијата (кодот може да го видите тука) ќе разгледаме неколку компоненти:

  • поставување тренинг податоци
  • собирање новости од неколку медиуми
  • парсирање на RSS/HTML текстови
  • класификација со статистичка метода
  • креирање кластер со статистичка метода

Алатки преку кои ќе бидат разгледани концептите:

  • Програмски јазик: Ruby 1.9.2
  • Стандардни библиотеки: open-uri, net/http, rss (rss/2.0), json
  • Други библиотеки: Sintara, Redis, Haml, Sass, Nokogiri
  • База на податоци: Redis

Цел на презентацијата:
  • агрегатор на новости како концепт и реализација
  • краток вовед во користените алатки со акцент на Redis и во какви сценарија може да се користи
  • дискусија на други алгоритми за класификација и кластерификација на текстови (Bayes, Latent Semantic Analysis, K-means
  • дискусија на архитектура за поголеми апликациии од овој тип (couchdb/mongodb, парсирање и анализа на македонски текстови)
  • разгледување идеи за апликации од овој вид во Македонија


Кликнете тука за поголема мапа.

No comments:

Post a Comment

Note: Only a member of this blog may post a comment.