生物學(xué)家必備大數(shù)據(jù)實(shí)用計(jì)算技巧
定 價(jià):198 元
叢書名:生物信息學(xué)數(shù)據(jù)分析叢書
當(dāng)前圖書已被 39 所學(xué)校薦購(gòu)過!
查看明細(xì)
- 作者:(美)S. H. D. 哈多克(Steven H. D.Haddock),(美)C. W. 鄧恩(Casey W. Dunn)
- 出版時(shí)間:2020/4/1
- ISBN:9787030644909
- 出 版 社:科學(xué)出版社
- 中圖法分類:Q811.4-39
- 頁(yè)碼:448頁(yè)
- 紙張:膠版紙
- 版次:1
- 開本:16K
面對(duì)生物數(shù)據(jù)的急速增長(zhǎng),對(duì)大數(shù)據(jù)的分析處理能力是生物學(xué)家普遍缺乏又急需掌握的能力。《生物學(xué)家必備大數(shù)據(jù)實(shí)用計(jì)算技巧》是在作者開發(fā)計(jì)算工具和幫助許多生物學(xué)家解決計(jì)算問題時(shí)總結(jié)經(jīng)驗(yàn)的基礎(chǔ)上誕生的,是針對(duì)生物學(xué)家撰寫的簡(jiǎn)明實(shí)用教程,它將一系列強(qiáng)大而靈活的實(shí)用工具匯集到一起,容易學(xué)習(xí)入門!渡飳W(xué)家必備大數(shù)據(jù)實(shí)用計(jì)算技巧》內(nèi)容以分子生物信息學(xué)數(shù)據(jù)為主,但也適用于多種其他生物數(shù)據(jù)的分析工作!渡飳W(xué)家必備大數(shù)據(jù)實(shí)用計(jì)算技巧》原版問世至今,一直是歐美高校生物專業(yè)和相關(guān)研究機(jī)構(gòu)必備的熱銷圖書。
更多科學(xué)出版社服務(wù),請(qǐng)掃碼獲取。
目錄
在開始之前 1
引言 1
為什么要寫這本書? 1
為什么只針對(duì)生物學(xué)家? 2
需要使用特定計(jì)算機(jī)或程序嗎? 2
寫給使用這本書自學(xué)的讀者 3
寫給使用這本書的教師 3
超越這本書 4
如何使用好這本書 4
第一部分 文 本 文 件
第1章 開始設(shè)置 9
關(guān)于文本文件的操作介紹 9
什么是文本文件 9
在一個(gè)文本文件內(nèi)組織數(shù)據(jù) 10
文本編輯器 11
安裝TextWrangler 11
在文本編輯器里優(yōu)化文本外觀 12
行尾結(jié)束符 13
示例文件 13
安裝示例文件 14
探索示例文件 14
總結(jié) 15
第2章 正則表達(dá)式:強(qiáng)大的搜索和替換 16
一種用于搜索和替換的廣泛語(yǔ)言 16
了解這個(gè)新工具箱的組件 17
設(shè)置文本編輯器 17
你的第一個(gè)通配符:\w 代替字母和數(shù)字 19
用()來捕獲文本 20
量詞:用+來對(duì)應(yīng)一個(gè)或多個(gè)實(shí)體 21
用\進(jìn)行標(biāo)點(diǎn)符號(hào)字符轉(zhuǎn)義 23
更為特殊的搜索項(xiàng):\s\t\r\d 24
示例:分子數(shù)據(jù)文件的重新格式化 25
關(guān)于生成正則表達(dá)式的評(píng)論 26
總結(jié) 27
第3章 探索正則表達(dá)式的靈活性 28
字符集:定義你自己的通配符 28
用[]定義定制的字符集 28
應(yīng)用自定義字符集 28
否定字符集:用[^]定義自定義字符集 30
邊界:^開頭和$結(jié)尾 31
使量詞更加精密 32
另一個(gè)量詞:*為零次或多次 32
用?修改貪婪程度 33
用{}符號(hào)控制匹配的數(shù)量 33
把所有都放在一起 34
生成替換關(guān)鍵詞 35
構(gòu)建可靠的搜索 36
總結(jié) 37
進(jìn)一步學(xué)習(xí) 38
第二部分Shell命令
第4章 命令行操作:shell 41
初次接觸:不要懼怕命令行 41
開始了解shell然后產(chǎn)生興趣 42
開始了解shell 42
文件系統(tǒng)的命令行視圖 43
路徑 44
利用shell在計(jì)算機(jī)里遨游 45
用ls列出文件,用pwd 找出你在哪里 45
如何用cd來回移動(dòng)位置 47
用~表示主目錄 48
用mkdir和rmdir來添加和移除文件夾 49
復(fù)制文件 49
移動(dòng)文件 51
命令行快捷鍵 51
向上箭頭鍵 51
Tab 52
用命令行參數(shù)來修正命令的行為 53
用less命令瀏覽文件內(nèi)容 54
在命令行中使用man命令查看幫助文件 55
命令行最終會(huì)使你的操作更容易 55
路徑描述中的通配符 55
復(fù)制和移動(dòng)多個(gè)文件 56
結(jié)束你的終端會(huì)話 57
總結(jié) 57
推薦閱讀 58
第5章 在shell中處理文本 59
用nano在命令行里編輯文本文件 59
控制shell里的數(shù)據(jù)流 61
用>重定向輸出到一個(gè)文件 61
用cat來顯示和連接文件 62
用grep在命令行中使用正則表達(dá)式 64
處理一個(gè)大數(shù)據(jù)集 64
從文件中抽提特定的行 64
用管道|將輸出從一個(gè)程序重定向到另一個(gè)程序 66
用grep跨越搜索多個(gè)文件 67
改善grep的行為 68
用curl 獲取Web 上的內(nèi)容 69
其他shell命令 71
總結(jié) 72
第6章 使用shell 編寫腳本 73
組合命令 73
搜索路徑 73
命令行如何找到它應(yīng)執(zhí)行的命令 73
創(chuàng)建你的工作區(qū)—腳本文件夾 75
編輯你的bash_profile文件來進(jìn)行個(gè)性化設(shè)置 76
檢查你的新$PATH 77
把文本文檔型文件轉(zhuǎn)變?yōu)檐浖?78
#!控制腳本文本用何種程序解釋 79
通過調(diào)整權(quán)限使文本文件可以被執(zhí)行 79
生成自動(dòng)腳本 81
批量復(fù)制文件 81
靈活的文件重命名 84
運(yùn)用curl自動(dòng)檢索參考文獻(xiàn) 86
用curl編寫腳本的幾個(gè)常用方法 88
用Alias創(chuàng)建快捷別名 88
總結(jié) 89
進(jìn)一步學(xué)習(xí) 89
第三部分 編 程
第7章 編程組件 93
程序是什么? 93
接下來幾章的目標(biāo) 93
實(shí)際編程 94
變量 95
變量的剖析 95
基本變量類型 96
能夠容納其他變量的變量 97
數(shù)組和列表 97
不同類型之間的轉(zhuǎn)換 99
運(yùn)行中的變量 99
數(shù)學(xué)運(yùn)算符 99
比較運(yùn)算符與邏輯運(yùn)算符 100
函數(shù) 101
流控制 102
用if語(yǔ)句做決策 102
由for與while構(gòu)成的循環(huán) 103
使用列表和字典 104
列表 104
字典 105
其他數(shù)據(jù)類型 105
輸入和輸出 106
用戶交互 106
文件 106
庫(kù)和模塊 107
注釋語(yǔ)句 108
對(duì)象 108
總結(jié) 109
第8章 開始使用Python編程 110
為什么選擇Python110
編寫程序 111
開始運(yùn)行程序 111
構(gòu)建dnacalcpy 程序 112
簡(jiǎn)單的print 語(yǔ)句 112
len()函數(shù) 114
使用str()、int()和float()轉(zhuǎn)換變量類型 115
內(nèi)置字符串函數(shù)count() 116
整數(shù)和浮點(diǎn)數(shù)的數(shù)學(xué)運(yùn)算 116
使用#添加評(píng)論 118
使用%運(yùn)算符控制字符串格式 118
獲取用戶輸入 120
使用raw_input()收集用戶輸入 120
用replace()和upper()整理變量 121
回顧你的程序 123
總結(jié) 123
第9章 決策與循環(huán) 124
Python交互式提示符 124
獲取Python的幫助 126
向dnacalcpy里添加更多的計(jì)算內(nèi)容 127
if條件語(yǔ)句 127
使用縮進(jìn)指定代碼塊 128
邏輯運(yùn)算符 128
if語(yǔ)句 129
else:語(yǔ)句 130
for循環(huán)介紹 132
列表簡(jiǎn)介 132
在proteincalcpy中寫入for 循環(huán) 133
創(chuàng)建字典 133
其他字典函數(shù) 139
應(yīng)用你學(xué)會(huì)的循環(huán)技能 140
回顧列表 140
列表的索引 141
從列表中解包多個(gè)值 143
用range()函數(shù)定義一個(gè)列表 143
列表和字符串的比較 145
列表和字符串之間轉(zhuǎn)換 146
向列表中添加元素 147
從列表中刪除元素 148
查找列表的內(nèi)容 148
給列表排序 148
識(shí)別列表及字符串中獨(dú)有的元素 149
列表推導(dǎo)式 150
總結(jié) 152
進(jìn)一步學(xué)習(xí) 153
第10章 讀取與寫入文件 154
目標(biāo)概述 154
從文件中逐條讀取每一行內(nèi)容 156
讀取數(shù)據(jù)文件之前的注意事項(xiàng) 156
打開并讀取文本文件 157
用strip()刪除行尾字符 159
跳過標(biāo)題行 159
從行中解析數(shù)據(jù) 160
將行拆分為數(shù)據(jù)字段 160
從列表中選擇元素 161
寫入文件 162
扼要重述文件的基本讀寫過程 164
使用正則表達(dá)式解析值 165
導(dǎo)入re模塊 165
通過re模塊使用正則表達(dá)式 165
research()與resub()的使用總結(jié) 167
使用def創(chuàng)建自定義Python函數(shù) 168
用新格式打包數(shù)據(jù) 173
檢查標(biāo)記語(yǔ)言 173
在轉(zhuǎn)換期間保留信息 174
轉(zhuǎn)換為KML格式 174
KML文件格式 174
生成KML文本 175
總結(jié) 179
進(jìn)一步學(xué)習(xí) 179
第11章 合并文件 180
從多個(gè)文件中讀取數(shù)據(jù) 180
使用sysargv 獲取用戶的輸入內(nèi)容 181
將所有參數(shù)轉(zhuǎn)換為文件列表 183
使用sysstderrwrite()提供反饋 184
循環(huán)遍歷文件列表 185
打印輸出并生成標(biāo)題行 187
避免硬編碼軟件 187
文件讀取的其他應(yīng)用 190
總結(jié) 192
進(jìn)一步學(xué)習(xí) 192
第12章 模塊與庫(kù) 194
導(dǎo)入模塊 194
更多來自標(biāo)準(zhǔn)庫(kù)的內(nèi)置模塊 196
urllib模塊 196
os模塊 197
math模塊 197
random模塊 198
time模塊 199
第三方模塊 200
NumPy 201
BioPython202
其他第三方模塊 203
制作自己的模塊 204
繼續(xù)深入學(xué)習(xí)Python 205
總結(jié) 206
進(jìn)一步學(xué)習(xí) 206
第13章 調(diào)試策略 207
在調(diào)試中學(xué)習(xí) 207
通用策略 208
建立工作元素 208
思考你的假設(shè) 208
具體的調(diào)試技術(shù) 209
隔離問題 209
編寫冗長(zhǎng)的軟件 210
錯(cuò)誤信息及其含義 211
常見的Python錯(cuò)誤 211
shell錯(cuò)誤 212
讓你的程序更有效率 212
優(yōu)化 212
使用try和except來處理錯(cuò)誤 213
當(dāng)你實(shí)在被困住時(shí) 214
總結(jié) 215
進(jìn)一步學(xué)習(xí) 215
第四部分 多種方法合并
第14章 選擇和組合工具 219
你的工具箱 219
數(shù)據(jù)處理任務(wù)的類別 219
獲取數(shù)字?jǐn)?shù)據(jù) 219
重新格式化文本文件 222
綜合考慮 226
總結(jié) 226
進(jìn)一步學(xué)習(xí) 226
第15章 關(guān)系型數(shù)據(jù)庫(kù) 227
電子表格和數(shù)據(jù)組織 227
數(shù)據(jù)管理系統(tǒng) 229
剖析一個(gè)數(shù)據(jù)庫(kù) 230
安裝MySQL 231
開始使用MySQL和SQL 233
連接到命令行中的MySQL服務(wù)器 233
創(chuàng)建數(shù)據(jù)庫(kù)和表 235
向表中添加數(shù)據(jù)行和顯示表的內(nèi)容 239
在Python中與MySQL進(jìn)行交互 240
解析輸入的文本 241
從數(shù)據(jù)中構(gòu)造SQL 243
從Python中執(zhí)行SQL命令 244
將文本文件導(dǎo)入到表格中 249
創(chuàng)建ctd表 250
用LOAD DATA命令導(dǎo)入數(shù)據(jù)文件 251
以SQL文件的形式導(dǎo)出和導(dǎo)入數(shù)據(jù)庫(kù) 253
用SQL探索數(shù)據(jù) 253
用SELECT和COUNT命令匯總表 253
用GROUP BY校對(duì)數(shù)據(jù) 255
SQL中的數(shù)學(xué)運(yùn)算 256
用WHERE對(duì)行進(jìn)行精確選擇 256
用UPDATE修改行 259
跨表選擇數(shù)據(jù) 260
使用Python生成輸出 262
繼續(xù)向前看 264
數(shù)據(jù)庫(kù)用戶和安全性 264
創(chuàng)建一個(gè)root密碼 265
添加一個(gè)新的MySQL用戶 265
總結(jié) 266
進(jìn)一步學(xué)習(xí) 267
推薦閱讀 267
第16章 高級(jí)的shell和管道命令 268
其他有用的shell 命令 268
用head和tail提取行 268
用cut提取列 268
用sort對(duì)行排序 270
用uniq分離出獨(dú)有的行 271
高級(jí)shell函數(shù)的整合 272
用agrep進(jìn)行近似搜索 275
額外的grep技巧 276
還記得別名嗎? 277
函數(shù) 278
用戶輸入的函數(shù) 281
一個(gè)字典函數(shù) 281
轉(zhuǎn)換字符 281
循環(huán)遍歷傳遞給函數(shù)的所有參數(shù) 282
刪除文件擴(kuò)展名 283
尋找文件 284
回顧管道命令 284
用循環(huán)重復(fù)操作 285
封裝器 286
對(duì)管道的一些想法 287
總結(jié) 287
推薦閱讀 288
第五部分 繪圖
第17章 圖像的概念 291
引言 291
常用的圖像類型 291
矢量圖與像素圖 291
決定何時(shí)用矢量圖?何時(shí)用像素圖?或是二者都用? 292
圖片分辨率與尺寸大小 294
圖像大小調(diào)整和對(duì)DPI 的錯(cuò)誤看法 295
圖片的顏色 297
顏色模型和色空間 297
顏色模型的轉(zhuǎn)換 298
色域與顏色配置文件 300
顏色選擇 300
決策過程總結(jié) 301
圖層 303
展示數(shù)據(jù)時(shí)通常需要考慮的因素 303
消除圖像的混亂 303
對(duì)于重疊數(shù)據(jù)的透明化處理 304
合理利用空間 304
一致性 306
保持?jǐn)?shù)據(jù)的完整性 306
為什么你應(yīng)該避免使用PowerPoint幻燈片 307
總結(jié) 307
進(jìn)一步學(xué)習(xí) 308
推薦閱讀 308
第18章 矢量圖的編輯和使用 310
矢量圖簡(jiǎn)介及原理 310
文件格式 310
生成矢量圖 310
從另一個(gè)程序輸出圖像 311
繪制一幅新的圖像 311
從一張照片中提取圖像 312
解析矢量圖 313
貝塞爾曲線 313
線型與填充 313
矢量圖編輯器的使用 314
選定并操作整個(gè)對(duì)象 314
選定并操作對(duì)象的一部分 315
利用鋼筆工具生成貝塞爾曲線 316
對(duì)貝塞爾曲線進(jìn)行修飾 316
聯(lián)結(jié)功能 317
線條與填充 317
圖層 318
Illustrator使用小貼士 319
Inkscape使用小貼士 321
一個(gè)典型的工作流程 321
生成規(guī)則排列的對(duì)象 323
生成矢量圖的最佳實(shí)踐 324
總結(jié) 325
進(jìn)一步學(xué)習(xí) 325
第19章 使用像素圖 326
圖像壓縮 326
通用原則 326
圖像工作流的含義 326
像素圖文件格式 327
透明度 328
像素圖編輯器 329
處理像素圖 329
遮罩和無損編輯 329
亮度水平的調(diào)整 329
灰度圖像 330
抗鋸齒 331
圖層 331
GIMP的色彩 332
Photoshop快捷鍵 332
圖像處理的命令行工具 333
sips程序 333
ImageMagick:convert和mogrify命令 333
ExifTool 334
圖像創(chuàng)建和分析工具 334
ImageJ 334
MATLAB 336
R 336
動(dòng)畫制作 336
攝影 337
光圈和曝光時(shí)間 337
色彩平衡 339
自動(dòng)vs手動(dòng)操作 340
總結(jié) 340
進(jìn)一步學(xué)習(xí) 340
第六部分 高級(jí)話題
第20章 在遠(yuǎn)程計(jì)算機(jī)上操作任務(wù) 343
連接到遠(yuǎn)程計(jì)算機(jī) 343
客戶端和服務(wù)器 343
典型的遠(yuǎn)程訪問情景 344
查找計(jì)算機(jī):IP地址、主機(jī)名和DNS 344
安全性 346
使用ssh的安全命令行連接 346
ssh命令 347
ssh命令使用時(shí)的故障排除 347
在遠(yuǎn)程機(jī)器上操作 348
計(jì)算機(jī)之間的文件傳輸 349
文件歸檔和壓縮 349
用sftp傳送文件 350
用scp復(fù)制文件 350
SFTP中其他的文件傳輸程序 351
其他的文件傳輸協(xié)議 351
通過VNC對(duì)遠(yuǎn)程計(jì)算機(jī)進(jìn)行完全GUI控制 351
排除遠(yuǎn)程連接障礙 352
使用虛擬專用網(wǎng)絡(luò)(VPN)連接到本地 352
用traceroute命令追蹤網(wǎng)絡(luò)連接 353
配置backspace鍵 353
控制程序如何運(yùn)行 354
結(jié)束進(jìn)程 354
用&在后臺(tái)開始任務(wù) 355
用ps和top命令來查看任務(wù)狀態(tài) 355
暫停任務(wù)并把它移至后臺(tái) 357
用kill命令來結(jié)束進(jìn)程 358
用nohup命令使任務(wù)繼續(xù)進(jìn)行 359
用renice命令更改程序的優(yōu)先級(jí) 360
高效計(jì)算 361
并行程序 361
大型計(jì)算機(jī)集群上的任務(wù)管理工具 361
搭建自己的服務(wù)器 362
配置ssh服務(wù)器 363
查找地址 363
用ssh 連接到你自己的計(jì)算機(jī) 364
總結(jié) 365
第21章 軟件安裝 366
概述 366
解釋程序與編譯程序 367
安裝軟件的方法 368
Readmetxt和Installtxt 368
通過預(yù)編譯的二進(jìn)制文件安裝程序 368
自動(dòng)安裝工具 369
從源代碼安裝命令行程序 370
準(zhǔn)備好你的計(jì)算機(jī) 370
解壓源代碼 370
編譯與安裝二進(jìn)制文件 371
變化情況1:現(xiàn)成的Makefile 372
變化情況2:用/configure生成Makefile文件 372
安裝Python組件 373
故障排除 374
軟件無法編譯或安裝無法完成怎么辦? 374
總結(jié) 376
進(jìn)一步學(xué)習(xí) 376
第22章 電子學(xué):與物理世界的互動(dòng) 377
生物學(xué)中定制的電子產(chǎn)品 377
生物學(xué)中定制電子產(chǎn)品的典型情景 377
具有復(fù)雜微控制器的簡(jiǎn)單電路 378
電子基礎(chǔ) 380
電流 380
基本元件 380
用電信號(hào)編碼信息 381
模擬編碼 381
數(shù)字編碼信號(hào) 382
搭建電路 383
電路原理圖 383
實(shí)驗(yàn)面包板 384
從電路原理圖翻譯成面包板電路 385
串行通信的實(shí)踐應(yīng)用 385
波特率和其他設(shè)置 386
零調(diào)制解調(diào)器 386
串行通信的軟件 387
通過Python進(jìn)行串行通信 388
Arduino微控制器板的實(shí)踐應(yīng)用 389
從哪里開始 389
用Arduino搭建電路 389
編程Arduino 390
其他數(shù)據(jù)采集的方法 393
常見的共同疑惑問題 394
測(cè)量電壓 394
電流和電子流 394
上拉和下拉電阻 395
總結(jié) 395
進(jìn)一步學(xué)習(xí) 396
推薦讀物 396
附錄
附錄1 用其他操作系統(tǒng)工作 399
Microsoft Windows 399
我應(yīng)該用Windows還是另外安裝Linux? 399
在第1~3章中用于編輯文本和正則表達(dá)式的文本編輯器 399
在第4~6章中使用Cygwin模擬Unix shell操作 401
第8~12章中在Windows里使用Python402
第15章中在Windows里使用MySQL 404
第17~19章中在Windows里處理矢量圖和像素圖 404
Linux 405
安裝Linux 405
在第1~3章中用jEdit進(jìn)行文本編輯和使用正則表達(dá)式 409
在第4~6章中使用Linux shell進(jìn)行shell操作 410
第8~12章中在Linux上使用Python 411
第15章使用MySQL 411
第17~19章在Linux中處理矢量圖和像素圖 411
附錄2 正則表達(dá)式檢索項(xiàng) 412
附錄3 shell命令 414
附錄4 Python快速參考 419
此附錄的規(guī)定 419
Python中的格式、語(yǔ)法和標(biāo)點(diǎn)符號(hào) 419
命令行解釋器 419
命令總結(jié) 420
變量類型和統(tǒng)計(jì) 420
字符串 420
收集用戶輸入 421
建立字符串 421
比較和邏輯運(yùn)算符 421
數(shù)學(xué)運(yùn)算符 422
決策 422
循環(huán) 423
用正則表達(dá)式檢索 423
用regexp在字符中尋找匹配子集 423
用regexp在字符串中做替換 424
使用列表 424
列表的理解 425
詞典 426
創(chuàng)建函數(shù) 426
處理文件 427
使用模塊和函數(shù) 428
容易混淆的Python操作 429
顯示警告和反饋 429
捕捉錯(cuò)誤 429
Python里的shell操作 429
參考及尋求幫助的渠道 429
附錄5 程序模板 430
Python27或更早的版本 430
Python3 431
Perl 431
bash shell 431
C 432
C++ 433
Java 433
JavaScript 434
PHP 435
Ruby 435
MATLAB 436
R 436
Arduino 437
附錄6 二進(jìn)制、十六進(jìn)制和ACSII碼 438
交替的基本系統(tǒng) 438
十六進(jìn)制 439
ASCII 碼和Unicode字符 440
圖像和色彩 441
十進(jìn)制、十六進(jìn)制、二進(jìn)制和ASCII 碼 442
附錄7 SQL命令 446