Saturday, November 1, 2014

Big Data và vai trò của nó trong truyền thông thế kỉ 21(Reactive Big Data and the age of "Social journalism")


Tóm tắt tiếng Việt như sau:
Vai trò của media (truyền thông) ngày càng quan trọng và sự phát triển của công nghệ để hỉểu hơn về bản chất dữ liệu (Insights) như một điều tất yếu.
Các câu chuyên của thế hệ truyền thông thế hệ kế tiếp cần tạo ra giá trị nhiều hơn, đặc biệt cần ứng dụng analytics để data có thể tìm đến đến đúng đối tuợng cần nó (reactive analytics) và truyền tải thông điệp trực quan hơn (Visual Insights).

1 Ý tuởng mới từ sự kết hợp các concepts khác nhau: 
xây dựng 1 big data platform cho nhà hoạt động truyền thông , các nhà báo chuyên nghiệp và không chuyên có thể tạo ra các content có giá trị hơn và ảnh huởng lớn hơn với xã hội.

Vài core concepts:

What is the "Insight" ?
 is the understanding of a specific cause and effect in a specific context.
http://en.wikipedia.org/wiki/Insight

Visual Insight ? 
Not everyone understands a chart !
http://cns.iu.edu/docs/presentations/2013-borner-visualinsights-cs10k.pdf

Reactive Big Data is the term, which describes how data actively is built for connecting people around the Internet to create new community and make true core value for people.
I have developed both the theory and the technology for this concept near 7 years, you can get more idea at http://www.mc2ads.com/p/rfx-for-big-data-developer.html

Social journalism is a media model consisting of a hybrid of professional journalism, contributor and reader content.[1] It is similar to open publishing platforms, like Twitter and WordPress.com, except that some or most content is also created and/or screened by professional journalists. http://en.wikipedia.org/wiki/Social_journalism

Data-driven journalism
Data-driven journalism, often shortened to "ddj", is a term in use since 2009/2010, to describe a journalistic process based on analyzing and filtering large data sets for the purpose of creating a news story. Main drivers for this process are newly available resources such as "open source" software and "open data"
http://en.wikipedia.org/wiki/Data-driven_journalism

Question: Can we use reactive big data to build better city and community ?
(Chúng ta có thể sử dụng công nghệ reactive big data để xây dụng 1 thành phố và cộng đồng tốt hơn ? )
Đây là 1 câu hỏi khá xa vời và trừu tuợng, nhưng nó là 1 nhu cầu thực sự, mọi nguời ngày nay ngày càng về các thành phố lơn để sinh sống và học tập. Sẽ như thế nào nếu bạn không có thông tin về chỗ bạn ở có an tòan hay không ? Chi phí sinh hoạt ? các loạt dịch vụ khác nhau ? ...
Bạn có thể Google từ Internet nhưng việc đánh giá mức độ chính xác của thông tin về mặt "bản địa hóa" (localization) và văn hóa thì Google vẫn chưa làm tốt ? nó không update thuờng xuyên và cá nhân hóa cho từng nhóm đối tuợng.

Tại sao là "Data-driven journalism" ? 
Sự thật là những thông tin tốt và có tính cập nhật thuờng xuyên thì không phải lúc nào cũng free !
Vì vậy, những nguời cung cấp tin cần đuợc trả công cho công việc cung cấp thông tin có giá trị, vai trò của báo chí nghiệp dư cần đuợc sử dụng để tạo vòng loop của nền kinh tế thông tin, tính update liên tục. Các công cụ data-driven cho các nhà báo nghiệp dư sẽ xây dựng để giúp quá trình tạo information dễ dàng và chính xác hơn.
http://datajournalismhandbook.org/1.0/en/understanding_data_7.html

Native advertising ? http://en.wikipedia.org/wiki/Native_advertising
Native advertising is a form of online advertising that matches the form and function of the platform on which it appears. The word "native" refers to the content's coherence with other media on the platform.
Example: http://www.copyblogger.com/examples-of-native-ads/
Refer: http://www.adexchanger.com/data-driven-thinking/how-is-data-science-changing-your-ad-business-let-us-count-the-ways/

Liệu chúng ta có thể kết hợp quảng cáo tự nhiên (native advertising) vào Data-driven journalism ?
Quảng cáo về bản chất là một hoạt động có tính xây dựng sự tuơng tác về mặt ý thức giữa nhà sản xuất và nguời tiêu dùng. Ở đây, cần hiểu nhà sản xuất chính là các content creator, và nguời tiêu dùng chính những nguời có nhu cầu về thông tin cho các nhu cầu cá nhân của họ (VD: thông tin tham khảo khi mua xe, mua smartphone, đi ăn, đi du lịch, đi chơi,...).
Tóm lại là các nhóm ngành dịch vụ ở 1 thành phố lớn, sẽ cần 1 chu trình kinh tế giữa bên bán và bên mua. Giá trị kinh tế nằm ở khả năng trao đổi, không phải ở số tiền trong nhà bank.
Refer: http://blog.revenue.com/native-advertising-2/how-big-data-can-save-newspapers/

Hiện tại  vẫn là ý tuởng từ vài cuốn sách, mô hình kinh doanh và công nghệ vẫn cần đuợc xây dựng thêm, 1 số sách mới mua và mình vẫn đang research .
Bạn thấy hứng thú và muốn tham gia: contact me at tantrieuf31@gmail.com, sẵn sàng share sách để cùng học hỏi và xây dựng :)


Thursday, October 2, 2014

Data Mining Topics for Digital Marketing

• Mining for Ad Relevance and Ranking
o Ad relevance measurement
o Ad ranking algorithms
o Ad text creation and evaluation
o CTR and conversion rate prediction
o Real-time bidding optimization
• Audience Intelligence & User Modeling
o User Tracking
o Understanding user intent
o Modeling online user behaviors for targeted advertisement
o User segmentation and profiling
o Demographics & location prediction
o Personalized advertising
• Content Understanding and Content Marketing
o Content-targeted advertising
o Opinion/sentiment mining
o Web scale information extraction for online advertisement
o Text mining techniques such as named entity extraction, query classification, keyword extraction, and other topics
o Understanding multimedia content for online advertisement
• Social, Mobile Advertising, and new advertising channels and formats
o Advertising through social networks and microblogging (such as Facebook and Twitter)
o Advertising through deals (such as Groupon and LivingSocial)
o Advertising on new channels such as mobile devices
o Mobile advertising
o Video advertising
o Native advertising
o Viral marketing
• Advertising Ecosystems
o Auction theory in online advertising
o Demand and supply volume prediction
o Measurement of online advertising effectiveness
o Search Engine Marketing, Optimization (SEMs, SEOs)
o Systems and technologies in ad exchange and RTB
• Trust and Privacy
o Consumer privacy and data use policy
o Privacy preserving data mining approaches
o Fraud and spam detection & prevention in online advertisements

Sunday, September 21, 2014

The future of AI and deep learning

Gigaom is hosting a meetup tonight in San Francisco about artificial intelligence and deep learning, and while the event itself is sold out I’m happy to announce that we will be streaming the event live. You can watch it, starting at 6 p.m. Pacific Time, here: http://new.livestream.com/gigaom/FutureofAI

Saturday, August 16, 2014

Big Data - from Simple Ideas to Advanced Concepts

Basic ideas:

Big Data - explained in a fun and easy way



5 V of Big Data
Basic Principles of Big Data System


More information at refer links:

Advanced concepts:

We, the human see data (structured), create new data (unstructured and structured) and the demand is finding the relationship inside new data. That's why big data was born !


How ?


Tuesday, July 29, 2014

Tại sao công nghệ AI deep learning không chỉ dành cho Facebook, Google, IBM, Netflix


Mục đích: Hiện thực 1 Java Web Service, nhằm đưa ra những thông tin hữu ích từ logs, có giá trị dựa trên những gì bạn thích hoặc tiềm năng trong tương lai, hoặc gây ra rủi ro nguy hiểm cao để mỗi cá nhân tự phòng tránh. (dành cho nhu cầu cá nhân mỗi người)




Implemented code:
Dùng Java 8 with Lambda
https://bitbucket.org/trieunt/rfx/src

1 vài open source tham khảo:
http://deeplearning4j.org/
http://jfuzzylogic.sourceforge.net/html/index.html
https://github.com/orientechnologies/orientdb/wiki/Graph-Database-Tinkerpop

Useful links:
Make suggestions based on what you actually like about your favorite information experience
http://gigaom.com/2014/07/29/robots-helped-inspire-deep-learning-and-might-become-its-killer-app/
http://blog.echen.me/2011/07/18/introduction-to-restricted-boltzmann-machines/
The application of Deep Learning in Collaborative Filtering
Netflix Is 'Training' Its Recommendation System By Using Amazon's Cloud To Mimic The Human Brain
http://www.quora.com/Deep-Learning/Whats-the-most-effective-way-to-get-started-with-Deep-Learning
http://ufldl.stanford.edu/wiki/index.php/UFLDL_Tutorial
http://deeplearning.stanford.edu/wiki/index.php/Main_Page
http://www.socher.org/index.php/DeepLearningTutorial/DeepLearningTutorial

Practical case studies
http://danielnouri.org/notes/2014/01/10/using-deep-learning-to-listen-for-whales/
http://radimrehurek.com/2013/09/deep-learning-with-word2vec-and-gensim/
http://radar.oreilly.com/2014/07/how-to-build-and-run-your-first-deep-learning-network.html