一、算法概述
算法是指解題方案的準(zhǔn)確而完整的描述,是一系列解決問題、高度符合邏輯性、可執(zhí)行性的指令集合,代表運用系統(tǒng)方法描述解決問題的策略機制。算法能夠?qū)σ欢ㄒ?guī)范的輸入在有限時間內(nèi)運行得到輸出。
算法中的指令描述的是計算過程,當(dāng)其運行時能從初始狀態(tài)和初始輸入(初始輸入可能為空的)開始,經(jīng)過一系列有限而清晰定義的狀態(tài),最終產(chǎn)生輸出并終止于某一狀態(tài)。
不同的算法在解決相同問題所需時間、空間可能不同,即算法的效率不同。算法的優(yōu)劣可通過解決相同問題所需的時間復(fù)雜度與空間復(fù)雜度衡量。
二、傳統(tǒng)算法與大數(shù)據(jù)算法
傳統(tǒng)的數(shù)據(jù)算法可被稱為數(shù)據(jù)分析,數(shù)據(jù)分析的目的在于對已有的數(shù)據(jù)進行描述性分析,其重點在于發(fā)現(xiàn)數(shù)據(jù)隱含的規(guī)律,進行商業(yè)分析和處理。
大數(shù)據(jù)時代的數(shù)據(jù)算法可被稱為數(shù)據(jù)科學(xué),與數(shù)據(jù)挖掘和機器學(xué)習(xí)相關(guān)。
機器學(xué)習(xí)是交叉學(xué)科,機器學(xué)習(xí)涉及的學(xué)科包括概率論、統(tǒng)計學(xué)、逼近論、圖分析、算法復(fù)雜度理論等。機器學(xué)習(xí)主要研究計算機怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識或技能,并重新組織已有的知識結(jié)構(gòu)使之不斷改善自身性能。
大數(shù)據(jù)機器學(xué)習(xí)更強調(diào)學(xué)習(xí)是手段。機器學(xué)習(xí)成為一種支持和服務(wù)技術(shù),基于機器學(xué)習(xí)對復(fù)雜多樣的數(shù)據(jù)進行深層次的分析和更高效地利用信息成為大數(shù)據(jù)機器學(xué)習(xí)研究的主要方向。所以,大數(shù)據(jù)機器學(xué)習(xí)逐漸向智能數(shù)據(jù)分析的方向發(fā)展,并已成為智能數(shù)據(jù)分析技術(shù)的重要組成部分。
大數(shù)據(jù)時代,數(shù)據(jù)體量以空前的速度增長,需要分析新類型數(shù)據(jù)也在不斷出現(xiàn),新類型數(shù)據(jù)包括:文本理解、文本情感分析、圖像的檢索和理解、圖形和網(wǎng)絡(luò)等。數(shù)據(jù)體量快速增長和新類型數(shù)據(jù)不斷出現(xiàn)使得大數(shù)據(jù)機器學(xué)習(xí)和數(shù)據(jù)挖掘等智能計算技術(shù)在大數(shù)據(jù)智能化分析處理應(yīng)用中具有重要作用。
圖片來源:學(xué)堂在線《大數(shù)據(jù)導(dǎo)論》
三、機器學(xué)習(xí)算法
目前,主流的機器學(xué)習(xí)算法包括:監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)。
(1)監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)是指從標(biāo)記的訓(xùn)練數(shù)據(jù)推斷某一功能的機器學(xué)習(xí)任務(wù),訓(xùn)練數(shù)據(jù)包括一套訓(xùn)練示例。每套訓(xùn)練示例均由一個輸入對象(通常為矢量)和一個期望的輸出值 (也稱為監(jiān)督信號)組成。監(jiān)督學(xué)習(xí)算法通過分析訓(xùn)練示例(個人理解:需分析多套訓(xùn)練示例),產(chǎn)生某種推斷功能,該推斷功能可以用于映射新示例。
監(jiān)督學(xué)習(xí)包括:分類算法和回歸分析。
1)分類算法包括:自然貝葉斯、決策樹、隨機森林、神經(jīng)網(wǎng)絡(luò)等。分類算法主要針對離散數(shù)據(jù)。
2)回歸類算法包括:線性回歸、邏輯回歸、支持向量機等?;貧w類算法主要針對連續(xù)數(shù)據(jù)。
(2)非監(jiān)督學(xué)習(xí)
非監(jiān)督學(xué)習(xí)是指在沒有類別信息情況下,通過分析所研究對象大量樣本的據(jù)數(shù),實現(xiàn)樣本分類的數(shù)據(jù)處理方法。
通過非監(jiān)督式學(xué)習(xí),可將樣本集劃分為若干個子集(類別),或?qū)颖炯鳛橛?xùn)練樣本集,再通過監(jiān)督學(xué)習(xí)方法進行分類器設(shè)計。
非監(jiān)督學(xué)習(xí)包括:聚類算法、抽維算法。
1)聚類算法包括:距離聚類、快速聚類等。
2)抽維算法包括:主因子、典型相關(guān)等。
審核編輯:劉清
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103647 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8503瀏覽量
134635 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8960瀏覽量
140253
原文標(biāo)題:大數(shù)據(jù)相關(guān)介紹(8)——算法
文章出處:【微信號:行業(yè)學(xué)習(xí)與研究,微信公眾號:行業(yè)學(xué)習(xí)與研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
AI算法托管平臺是什么
PID控制算法的C語言實現(xiàn):PID算法原理
深入解析ECC256橢圓曲線加密算法

【「從算法到電路—數(shù)字芯片算法的電路實現(xiàn)」閱讀體驗】+內(nèi)容簡介
【「從算法到電路—數(shù)字芯片算法的電路實現(xiàn)」閱讀體驗】+介紹基礎(chǔ)硬件算法模塊
【「從算法到電路—數(shù)字芯片算法的電路實現(xiàn)」閱讀體驗】+一本介紹基礎(chǔ)硬件算法模塊實現(xiàn)的好書
激光雷達(dá)在SLAM算法中的應(yīng)用綜述

評論