大數據處理技術--R語言專利分析方法與應用

大數據處理技術--R語言專利分析方法與應用
定價:348
NT $ 303
  • 作者:屠忻
  • 出版社:知識產權出版社
  • 出版日期:2019-09-01
  • 語言:簡體中文
  • ISBN10:7513064342
  • ISBN13:9787513064347
  • 裝訂:平裝 / 200頁 / 16k / 19 x 26 x 1 cm / 普通級 / 單色印刷 / 1-1
 

內容簡介

本書是一本關於大資料處理技術的圖書,主要研究R語言在專利分析領域的應用方法。全書從四個方面展開:首先給出R語言快速入門需要掌握的基本知識;然後從專利分析資料處理角度出發,總結歸納用R語言處理專利資料的幾種常用場景;接著結合專利分析中的資料視覺化給出常用專利分析圖表的R語言製圖方法;最後結合資料採擷演算法介紹了利用R語言進行專利資料採擷與建模的幾種常見任務。
 

作者介紹

屠忻:畢業于南京大學,2002年起在國家智慧財產權局專利局工作。現就職於國家智慧財產權局專利局專利審查協作江蘇中心光電部,副研究員,國家智慧財產權局高層次人才,國際型審查專家,局級教師。

李立功:畢業於中國科學院半導體研究所,工學博士。現就職於國家智慧財產權局專利局專利審查協作江蘇中心,副研究員,國家智慧財產權局骨幹人才,參與過多項專利分析與預警專案,在智慧財產權類刊物上發表多篇學術論文。

左良軍:國家智慧財產權局專利局專利審查協作江蘇中心審查員,工學碩士,助理研究員,參與編寫教科書《專利分析資料處理實務手冊》,參與過多項專利分析與導航專案,在智慧財產權類刊物上發表多篇學術論文。

楊爽:曾任企業軟體研發工程師,現就職於國家智慧財產權局專利局專利審查協作江蘇中心,專利審查員,工學碩士,參與過多項專利分析與導航專案。

高慧霞:國家智慧財產權局專利局專利審查協作江蘇中心審查員,理學博士,助理研究員,國家智慧財產權局骨幹人才,參與過多項專利分析與預警專案,發表過多篇學術論文。

黃煜:國家智慧財產權局專利局專利審查協作江蘇中心審查員,工程碩士,助理研究員,熟悉專利分析實務,參與過高價值專利培育專案,在智慧財產權類刊物上發表過多篇文章。

蔣帆:國家智慧財產權局專利局專利審查協作江蘇中心審查員,工學碩士,助理研究員,從事電、磁測試領域發明專利實質審查工作,著有《Arduino探究實驗》。
 

目錄

第1章 簡 介001
1.1 關於本書 001
1.1.1 為什麼要撰寫本書 001
1.1.2 本書的撰寫原則 002
1.1.3 本書的讀者對象 003
1.1.4 本書的使用方法 004
1.2 專利分析概論 004
1.2.1 專利分析基本流程 004
1.2.2 當前專利分析基本方法 010
1.2.3 專利分析的發展方向 011
1.3 資料科學概論 012
1.3.1 資料取樣與探索 012
1.3.2 數據預處理與視覺化 013
1.3.3 資料採擷與建模 014
1.4 小結 014

第2章 R語言入門016
2.1 本章概述 016
2.2 R語言簡介與安裝 017
2.2.1 R語言簡介 017
2.2.2 R安裝及RStudio簡介 018
2.3 R包的使用 021
2.3.1 R包的介紹 021
2.3.2 R包的安裝和載入 022
2.4 常用R包及函數使用介紹 023
2.4.1 資料整理——tidyr 023
2.4.2 表格操縱——dplyr 027
2.4.3 字元處理——stringr 031
2.4.4 時間處理——lubridate 034
2.4.5 數據導入匯出——openxlsx 036
2.5 R語言資料結構 037
2.5.1 向量 037
2.5.2 矩陣 038
2.5.3 陣列 039
2.5.4 數據框 040
2.5.5 因數 042
2.5.6 列表 043
2.6 小結 044

第3章 專利資料處理045
3.1 本章概述 045
3.2 申請年份統計 046
3.2.1 年份申請量統計 047
3.2.2 年份國內外申請量統計 050
3.2.3 年份國別申請量統計 052
3.3 專利申請人統計 055
3.3.1 申請人專利數量統計 056
3.3.2 標準申請人清洗 058
3.3.3 申請人合作關係統計 062
3.4 技術主題統計 069
3.4.1 技術主題分佈統計 069
3.4.2 技術主題占比統計 072
3.5 同族資料統計 073
3.5.1 同族數據拆分為多列 073
3.5.2 同族數據拆分為多行 076
3.6 多維資料聯合統計 080
3.6.1 三維資料的聯合統計 080
3.6.2 四維資料的聯合統計 085
3.7 小結 086

第4章 專利資料視覺化087
4.1 本章概述 087
4.2 利用ggplot2包製圖 088
4.2.1 柱形(條形)圖 088
4.2.2 折線(路徑)圖 098
4.2.3 散點(氣泡)圖 103
4.3 利用Highcharter包製圖 108
4.3.1 圓環類圖 109
4.3.2 極座標圖 113
4.3.3 矩形樹圖及熱力圖 118
4.4 利用Dygraphs包繪製互動式時序圖 121
4.4.1 折線時序圖 122
4.4.2 折線+條形時序圖 123
4.4.3 堆疊條形+折線時序圖 124
4.5 利用Circlelize包製圖 126
4.5.1 申請人合作關係弦圖 126
4.5.2 五局技術流向弦圖 128
4.5.3 條形跑道圖 132
4.6 專利地圖的繪製 134
4.6.1 基於baidumap和Remap包繪製地圖 135
4.6.2 專利地圖與其他圖表的結合 140
4.7 利用NetworkD3包製圖 145
4.7.1 力導圖 145
4.7.2 網路圖 152
4.8 小結 155

第5章 專利資料採擷與建模156
5.1 本章概述 156
5.2 資料採擷基礎 157
5.2.1 資料採擷的基本任務 157
5.2.2 資料採擷建模的過程 158
5.3 變數主成分分析 159
5.3.1 問題背景 159
5.3.2 主成分分析方法 160
5.4 聚類分析 166
5.4.1 問題背景 166
5.4.2 K-means聚類分析 166
5.5 分類與預測分析 173
5.5.1 問題背景 173
5.5.2 人工神經網路演算法 174
5.5.3 支援向量機演算法 181
5.5.4 樸素貝葉斯演算法 185
5.6 小結 189
附錄A 本書代碼索引190
附錄B 本書用到的擴展包192
附錄C R語言學習資源195
參考文獻198
網路書店 類別 折扣 價格
  1. 新書
    87
    $303