應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

數(shù)據(jù)驅(qū)動(dòng)算法在機(jī)器學(xué)習(xí)中的應(yīng)用

2021-07-22 08:58 千家網(wǎng)

導(dǎo)讀:機(jī)器學(xué)習(xí)作為一個(gè)概念,與提高計(jì)算機(jī)使用算法和神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)的能力有關(guān),并能更快更有效地執(zhí)行各種任務(wù)。機(jī)器學(xué)習(xí)或ML通過(guò)使用數(shù)據(jù)或數(shù)據(jù)集來(lái)幫助建立模型來(lái)做出決策。

機(jī)器學(xué)習(xí)的概念分析

機(jī)器學(xué)習(xí)作為一個(gè)概念,與提高計(jì)算機(jī)使用算法和神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)的能力有關(guān),并能更快更有效地執(zhí)行各種任務(wù)。機(jī)器學(xué)習(xí)或ML通過(guò)使用數(shù)據(jù)或數(shù)據(jù)集來(lái)幫助建立模型來(lái)做出決策。它可用于精簡(jiǎn)組織的決策和執(zhí)行績(jī)效。這個(gè)詞是1959年由美國(guó)人阿瑟·塞繆爾(ArthurSamuel)首創(chuàng)的,他精通人工智能和電腦游戲。

從概念上講,機(jī)器學(xué)習(xí)模擬了人類的腦細(xì)胞交互模式。在大腦活動(dòng)中,當(dāng)神經(jīng)元相互交流時(shí),這些神經(jīng)元反過(guò)來(lái)使人類能夠輕松地執(zhí)行各種功能和任務(wù),而不需要任何其他外部形式的支持。就像人類大腦中的神經(jīng)元根據(jù)情況來(lái)解剖每個(gè)任務(wù)一樣,在ML中,數(shù)據(jù)按照各種算法來(lái)預(yù)測(cè)、分類和表示,解決一個(gè)復(fù)雜問(wèn)題并提出解決方案。

機(jī)器學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)模型也是基于DonaldHebb博士在TheOrganizationofBehavior中的理論。在制定機(jī)器學(xué)習(xí)概念方面的一些顯著貢獻(xiàn)是基于1950年代IBM的ArthurSamuel的進(jìn)化工作的逐步實(shí)施,他開(kāi)發(fā)了一個(gè)計(jì)算機(jī)程序。該計(jì)算機(jī)程序涉及alpha-beta剪枝,用于測(cè)量跳棋游戲中每一方獲勝的機(jī)會(huì)。緊隨其后的是由FrankRosenblatt于1957年開(kāi)發(fā)的定制機(jī)器感知器,專為圖像識(shí)別而構(gòu)建,導(dǎo)致了MercelloPelillo于1967年開(kāi)發(fā)的用于基本模式識(shí)別的最近鄰算法。

機(jī)器學(xué)習(xí)算法和模型

機(jī)器學(xué)習(xí)是基于算法和模型的校準(zhǔn)功能。簡(jiǎn)單地說(shuō),算法可以稱為利用結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)產(chǎn)生輸出的簡(jiǎn)單過(guò)程。同時(shí),機(jī)器學(xué)習(xí)模型表示程序和程序(算法)的結(jié)合,即使用程序來(lái)達(dá)到預(yù)期的結(jié)果,完成預(yù)期的任務(wù)。

算法是一個(gè)公式,通過(guò)它可以做出預(yù)測(cè);機(jī)器學(xué)習(xí)模型是實(shí)現(xiàn)算法后產(chǎn)生的輸出的更廣泛的方面。因此,在技術(shù)層面上,可以引用機(jī)器學(xué)習(xí)算法導(dǎo)致ML模型,而不是反之。為了理解ML算法的功能,讓我們先看看機(jī)器學(xué)習(xí)中的模型。

機(jī)器學(xué)習(xí)模型分為三大類:

監(jiān)督學(xué)習(xí):在監(jiān)督學(xué)習(xí)中,在不確定的情況下,通過(guò)計(jì)算證據(jù),從已知的數(shù)據(jù)集(輸入)和已知的數(shù)據(jù)響應(yīng)(輸出)做出預(yù)測(cè),以開(kāi)發(fā)新的數(shù)據(jù)或數(shù)據(jù)集作為響應(yīng)。監(jiān)督學(xué)習(xí)進(jìn)一步使用分類和回歸等技術(shù)來(lái)提出其他機(jī)器學(xué)習(xí)模型。無(wú)監(jiān)督學(xué)習(xí):無(wú)監(jiān)督學(xué)習(xí)包括從輸入數(shù)據(jù)中得出推論,而不從具有內(nèi)在數(shù)據(jù)集或結(jié)構(gòu)的隱藏模式中標(biāo)記出響應(yīng)。強(qiáng)化學(xué)習(xí):在機(jī)器學(xué)習(xí)的強(qiáng)化學(xué)習(xí)模型中,基于試錯(cuò)法,在復(fù)雜環(huán)境下做出一系列決策。根據(jù)所做決定的結(jié)果,獎(jiǎng)勵(lì)和懲罰有助于最終引出回應(yīng)。

現(xiàn)在為了詳細(xì)說(shuō)明機(jī)器算法做了什么,讓我們以一個(gè)基于聚類的機(jī)器學(xué)習(xí)算法K-means為例??紤]了幾個(gè)聚類,以k為變量。識(shí)別每個(gè)簇的中心或質(zhì)心,并在其基礎(chǔ)上定義一個(gè)數(shù)據(jù)點(diǎn)。在幾次迭代中,數(shù)據(jù)點(diǎn)和集群被重新識(shí)別,一旦定義了所有中心,數(shù)據(jù)點(diǎn)將與每個(gè)集群對(duì)齊,并與集群中心相接近。該算法在訓(xùn)練數(shù)據(jù)上表現(xiàn)出色,有助于分類各種人工智能程序的音頻檢測(cè)和圖像分割等復(fù)雜任務(wù)。

使機(jī)器學(xué)習(xí)成為一個(gè)進(jìn)步的領(lǐng)域,根據(jù)業(yè)務(wù)需求探索和發(fā)展的另一個(gè)方面是它對(duì)數(shù)據(jù)處理的需求。各種形式的訓(xùn)練數(shù)據(jù)是機(jī)器學(xué)習(xí)的基礎(chǔ)。從檢測(cè)用于安全目的的對(duì)象到預(yù)測(cè)業(yè)務(wù)趨勢(shì),高效和高性能的算法本質(zhì)上是以數(shù)據(jù)為中心的;數(shù)據(jù)集越精確,算法產(chǎn)生的輸出就越準(zhǔn)確。

機(jī)器學(xué)習(xí)中數(shù)據(jù)驅(qū)動(dòng)的算法

在物理世界中,人類互動(dòng)的大部分方面都是基于與各種無(wú)形數(shù)據(jù)的動(dòng)態(tài)關(guān)系,人類的大腦每天都會(huì)執(zhí)行許多簡(jiǎn)單的數(shù)據(jù)驅(qū)動(dòng)計(jì)算。類似地,計(jì)算是基于機(jī)器學(xué)習(xí)中的數(shù)據(jù)或標(biāo)記訓(xùn)練數(shù)據(jù),這有助于基于人工智能(AI)的程序工作來(lái)增加價(jià)值。與編寫(xiě)程序代碼自動(dòng)化處理過(guò)程或?qū)Υ罅繑?shù)據(jù)進(jìn)行深入調(diào)查相比,算法的使用要可靠得多,速度也快得多。

機(jī)器學(xué)習(xí)算法是一種數(shù)學(xué)方法,在提供的數(shù)據(jù)的幫助下產(chǎn)生一組結(jié)果。因此,在機(jī)器學(xué)習(xí)的過(guò)程中,數(shù)據(jù)的重要性是至關(guān)重要的。由ML驅(qū)動(dòng)的人工智能程序的效率取決于輸入算法代碼的訓(xùn)練數(shù)據(jù)的質(zhì)量。不準(zhǔn)確的數(shù)據(jù)集也會(huì)降低性能。

對(duì)于一個(gè)ML算法產(chǎn)生高價(jià)值的輸出,可用性的高質(zhì)量的訓(xùn)練數(shù)據(jù)集是必須的。訓(xùn)練數(shù)據(jù)集是根據(jù)人工智能應(yīng)用程序的目標(biāo)開(kāi)發(fā)的注釋或說(shuō)明數(shù)據(jù)。

主要是兩種類型的數(shù)據(jù)推動(dòng)了機(jī)器學(xué)習(xí)算法的工作。

1.手工數(shù)據(jù)標(biāo)簽

2.自動(dòng)數(shù)據(jù)標(biāo)簽

3.人工智能輔助的數(shù)據(jù)標(biāo)注

在自動(dòng)、手動(dòng)和人工輔助數(shù)據(jù)標(biāo)注方面有一些關(guān)鍵的區(qū)別。在手動(dòng)數(shù)據(jù)標(biāo)簽,人群強(qiáng)制標(biāo)簽的原始數(shù)據(jù)按照共享的指導(dǎo)方針或技術(shù)定義附加標(biāo)簽。而在自動(dòng)數(shù)據(jù)標(biāo)注中,訓(xùn)練數(shù)據(jù)由程序標(biāo)注,并在加載執(zhí)行前檢查其準(zhǔn)確性。而且,人工智能輔助的數(shù)據(jù)標(biāo)記需要自動(dòng)程序和人工努力來(lái)產(chǎn)生高質(zhì)量的訓(xùn)練數(shù)據(jù)。

基于數(shù)據(jù)的算法在現(xiàn)實(shí)世界中的應(yīng)用

算法和技術(shù)適用于各行業(yè)和經(jīng)濟(jì)部門。在數(shù)字技術(shù)和數(shù)據(jù)驅(qū)動(dòng)的生態(tài)系統(tǒng)時(shí)代,復(fù)雜的需求面臨著高效數(shù)據(jù)創(chuàng)建和開(kāi)發(fā)的挑戰(zhàn),在智慧城市、網(wǎng)絡(luò)安全、智能醫(yī)療、社交媒體和商業(yè)等領(lǐng)域,ML也在不斷實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)化和可用數(shù)據(jù)處理,以更好地做出決策。提高績(jī)效,增強(qiáng)業(yè)務(wù)可持續(xù)性。

在衛(wèi)生部門,人工智能程序正在執(zhí)行由高度可用的訓(xùn)練數(shù)據(jù)驅(qū)動(dòng)的任務(wù)。這些數(shù)據(jù)使諸如二十億等健康應(yīng)用程序通過(guò)檢測(cè)對(duì)象、動(dòng)作、屬性、視聽(tīng)輸入、語(yǔ)音輸入、神經(jīng)網(wǎng)絡(luò)、語(yǔ)音輸出、身體控制等來(lái)幫助客戶跟蹤他們的健康訓(xùn)練計(jì)劃的進(jìn)度。,正在幫助支持AI的應(yīng)用程序解碼復(fù)雜的任務(wù),例如:

了解現(xiàn)場(chǎng)理解口語(yǔ)理解對(duì)象和動(dòng)作通過(guò)聊天機(jī)器人生成口語(yǔ)控制助理的身體理解人類的姿勢(shì)將視覺(jué)概念與文字等聯(lián)系起來(lái)行為

在金融等領(lǐng)域,機(jī)器學(xué)習(xí)算法正在幫助企業(yè)發(fā)現(xiàn)未來(lái)的投資機(jī)會(huì);同時(shí),對(duì)于政府部門,ML算法通過(guò)簡(jiǎn)單地處理來(lái)自多個(gè)來(lái)源的復(fù)雜數(shù)據(jù),幫助處理欺詐、身份盜竊和提高公共工程的效率。此外,隨著數(shù)據(jù)量越來(lái)越大,機(jī)器學(xué)習(xí)(ML)正通過(guò)使用復(fù)雜的數(shù)據(jù)集來(lái)增加價(jià)值,幫助垂直企業(yè)應(yīng)對(duì)未來(lái)的諸多挑戰(zhàn)。

尾注

理想情況下,機(jī)器學(xué)習(xí)被用于處理涉及大量數(shù)據(jù)的復(fù)雜計(jì)算任務(wù),而沒(méi)有靜態(tài)公式來(lái)得出結(jié)果。多年來(lái),隨著機(jī)器學(xué)習(xí)領(lǐng)域的不斷研究和發(fā)展,醫(yī)療、能源生產(chǎn)、汽車、航空航天、制造業(yè)和金融等商業(yè)部門都從機(jī)器學(xué)習(xí)模式中獲益。機(jī)器學(xué)習(xí)模型和算法正在幫助解決特定行業(yè)的問(wèn)題,并通過(guò)對(duì)象檢測(cè)、信用評(píng)分、交易預(yù)測(cè)、DNA測(cè)序和預(yù)測(cè)性維護(hù)提供未來(lái)的全行業(yè)解決方案。

在未來(lái)幾年,隨著數(shù)據(jù)的持續(xù)增長(zhǎng)和對(duì)可變數(shù)據(jù)的需求進(jìn)一步攀升,我們可以希望看到許多其他任務(wù)使用由機(jī)器學(xué)習(xí)算法支持的人工智能程序來(lái)執(zhí)行,這些程序的模型有助于閱讀和處理數(shù)據(jù),并為全球企業(yè)部門提供均衡的可持續(xù)性。