av日韩亚洲,一本一本a久久,亚洲一区二区三区,亚洲一区二区三区免费视频

基于大數據技術的高職招生平臺建設研究

來源:期刊VIP網所屬分類:統計學時間:瀏覽:

  摘 要:針對高職院校招生信息化面臨的諸多問題,本文借助大數據技術,提出了基于大數據技術的高職招生平臺建設研究,并對平臺的整體架構和主要功能設計進行了探討。本研究整合學校招生、培養、就業數據并抓取網絡上的相關信息,為高職院校輔助制定招生政策提供指導服務。

  關鍵詞:大數據技術;招生平臺研究;輔助招生決策

大數據論文

  隨著現代科技的發展,信息技術的應用越來越廣泛,高校招生已經有了非常豐富的報考和招生信息。隨著新高考改革的推進,高職院校的招生模式不斷創新和多樣化,優質生源競爭也越來越激烈,各高校在制定招生專業計劃時,需對歷年本校及競爭學校招生錄取過程中收集到的各種招生數據信息進行研究分析,同時也需對市場上的就業招聘信息與招生工作進行相關分析,從而更科學地制定招生政策、招生計劃,提高生源質量,促進學校發展。

  一、問題及現狀

  1.招生各數據源信息不一致

  大多數高校是面向全國招生的,各省份招生政策存在差異,下載數據在結構上有較大差異,考生信息數據列、數據含義也有較大差別。甚至同一個省份的多元化招生模式,如提前招生、五年制合作、普高高考、單獨考試等,不同招生類型考生數據信息也不統一。生源數據結構和標準不統一,給數據共享和統計分析造成了很大工作量。

  2.各系統各自獨立形成信息孤島

  大多數高校各部門為了工作方便都會有信息化系統,但缺乏統一規劃,系統間彼此獨立,互不兼容,造成存在不同的數據格式標準和數據庫;甚至同一部分在不同時期建立的系統之間也未能形成信息共享體系,如招生宣傳網、招生數據管理、提前招生,就業管理等多個系統,這些數據孤立地存放在本地數據庫里,對這些系統數據隱含的價值以及數據之間的關聯沒有深入挖掘和利用,無法提供更深層次的決策服務。

  3.“招生-培養-就業”未形成聯動

  高校的人才培養由招生、培養和就業構成,三個環節緊密相連,共同構成高校人才培養的系統過程。通過多年的招生、培養、就業數據積累,數據體現出數據量巨大、數據價值增加、數據種類多樣、數據處理復雜等重要特點,當前就業招聘市場的信息變化常常預示后繼幾年社會對人才需求的變化,高校當前招生專業及人數的精準管理需要同時研究就業市場的數據來進行優化,如果沒有應用大數據平臺來進行分析和挖掘,就不能充分利用招生、就業數據的價值,就無法形成三個環節數據的聯動。

  二、 招生平臺整體架構設計思路

  建立一個基于大數據的招生平臺必須要有一個技術層次合理的系統架構(如圖1所示)。平臺從下往上可以分為四層:一是數據治理層,負責招生數據及相關就業數據的導入、抓取、清洗、規范化等數據治理工作;二是大數據平臺層,運用以Hadoop為代表的大數據技術,對歸集的招生、就業、招聘數據進行處理;三是數據應用層,對大數據處理層處理的結果基于招生業務需要進行功能設計、統計分析、數據相關性計算等,并進行大數據展示,以及歷年招生大數據的展現,用于招生政策決策分析;四是應用門戶,將數據應用層產生的業務結果數據以網站、手機APP、手機微信應用等多種形式提供給用戶端使用。

  1.數據治理層

  招生平臺數據來源:一方面有學校歷年的招生數據,數據源格式有Excel、各類文件、關系數據庫數據,這些數據的格式差別很大,需要進行數據規范化、標準化后導入招生平臺數據倉庫;另一方面,為了開展招生、培養、就業全過程數據的分析研究,我們還要導入學校學生培養期間成績數據、企業招聘數據、學生就業數據等,這些數據來源有Excel、各類文件、關系數據庫數據,以及通過Python爬蟲爬取的互聯網各類網站上的數據。簡單來說,數據治理就是處理數據的策略——收集、驗證、存儲、訪問、保護和使用數據。數據治理層就是針對這些不同的數據源、不同的數據格式,通過數據治理工具開展數據格式規整、數據值域規范化、元數據標準化相關工作,同時通過ETL工具去除一部分臟數據,將元數據、主數據、招生就業數據、企業招聘參考數據生成標準、規范、有價值的數據集并導入招生平臺數據倉庫。

  2.大數據平臺層

  大數據平臺層對數據治理后導入的招生、就業、學業、招聘相關信息進行數據處理?;跀祿愋投鄻蛹皵祿魁嫶?,采用關系數據庫、NoSql和Hbase數據庫相結合的模式。Hadoop主要由兩部分組成:一是HDFS,即Hadoop Distributed file System,是屬于Hadoop的分布式文件系統;二是Hadoop MapReduce,它是一種分布式計算引擎,包括大規模的文字處理、數據挖掘等,它分兩個階段,一個是Map階段,一個是Reduce階段,Map階段就是把輸入來的諸多并行任務分給各個節點分別計算處理,Reduce則將Map分到各節點處理的結果進行匯總。Hive是一個構建在Hadoop上的數據倉庫工具,通過Hive將存儲在HDFS平臺上的數據與傳統SQL結合起來,輕松地向Hadoop遷移。

  3.數據應用層

  根據大數據平臺層的基礎數據與業務數據處理結果,開發招生業務相關的招生志愿填報智能服務、中高職銜接、招生宣傳管理、招生數據綜合分析展現等應用,同時將就業數據、企業招聘數據與招生數據進行相關性研究,提供招生政策、招生計劃來輔助決策功能。

  4.應用門戶層

  應用門戶層是將招生平臺的功能與數據向用戶端推送。用戶端的形式有Web門戶網站、手機APP、手機微信公眾號和微信小程序,同時將數據應用層開發業務邏輯封裝成HTML5頁面提供給第三方用戶端門戶,包括電視終端。用戶端查詢、交互性能基于業務邏輯及 Hadoop數據平臺進行優化。

  推薦閱讀:大數據研究論文如何發表

主站蜘蛛池模板: 临沭县| 横峰县| 霸州市| 沛县| 大宁县| 濮阳市| 伊宁市| 苗栗市| 鹤岗市| 南投县| 许昌县| 霍州市| 屯昌县| 晋州市| 贺兰县| 淮北市| 松潘县| 杨浦区| 巴青县| 开鲁县| 安溪县| 志丹县| 巴楚县| 稻城县| 伊吾县| 黑水县| 遂昌县| 河北区| 甘泉县| 广丰县| 武威市| 云梦县| 库尔勒市| 宝应县| 虹口区| 江源县| 泰安市| 通城县| 安陆市| 珠海市| 天柱县|