Discuz代码研究-编码规范
生活随笔
收集整理的這篇文章主要介紹了
Discuz代码研究-编码规范
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
來源:http://www.cnblogs.com/janas/archive/2013/08/20/3271408.html
Discuz中的編碼規范很值得PHP開發人員借鑒。里面既介紹了編碼時代碼標記,注釋,書寫規則,命名原則等方面基礎的內容,對代碼的安全性,性能,兼容性,代碼重用,數據庫設計,數據庫性能及優化作了闡述,這個是開發人員必須掌握的技巧。同時也對模板的規范進行了介紹。
?
以下是對其編碼規范的引用,編碼規范地址:http://open.discuz.net/?ac=document&page=dev_coderule
?
Discuz! 的編碼規范
目錄
|
前言
適用范圍
標準化的重要性和好處
- 程序員可以了解任何代碼,弄清程序的狀況
- 新人可以很快的適應環境
- 防止新接觸PHP的人出于節省時間的需要,自創一套風格并養成終生的習慣
- 防止新接觸PHP的人一次次的犯同樣的錯誤
- 在一致的環境下,人們可以減少犯錯的機會
- 程序員們有了一致的敵人
PHP編碼規范與原則
代碼標記
注釋
- IdId
例如:
/*** [Discuz!] (C)2001-2099 Comsenz Inc.* This is NOT a freeware, use is subject to license terms** $Id$*/書寫規則
縮進
大括號{}、if和switch
- 首括號與關鍵詞同行,尾括號與關鍵字同列;
- if結構中,else和elseif與前后兩個大括號同行,左右各一個空格。另外,即便if后只有一行語句,仍然需要加入大括號,以保證結構清晰;
- switch結構中,通常當一個case塊處理后,將跳過之后的case塊處理,因此大多數情況下需要添加break。break的位置視程序邏輯,與case同在一行,或新起一行均可,但同一switch體中,break的位置格式應當保持一致。
以下是符合上述規范的例子:
if($condition) {switch($var) {case 1: echo ‘var is 1’; break;case 2: echo ‘var is 2’; break;default: echo ‘var is neither 1 or 2’; break;} } else {switch($str) {case ‘abc’:$result = ‘abc’;break;default:$result = ‘unknown’;break;} }運算符、小括號、空格、關鍵詞和函數
- 每個運算符與兩邊參與運算的值或表達式中間要有一個空格,唯一的特例是字符連接運算符號兩邊不加空格;
- 左括號“(” 應和函數關鍵詞緊貼在一起,除此以外應當使用空格將“(”同前面內容分開;
- 右括號“)”除后面是“)”或者“.”以外,其他一律用空格隔開它們;
- 除字符串中特意需要,一般情況下,在程序以及HTML中不出現兩個連續的空格;
- 任何情況下,PHP程序中不能出現空白的帶有TAB或空格的行,即:這類空白行應當不包含任何TAB或空格。同時,任何程序行尾也不能出現多余的TAB或空格。多數編輯器具有自動去除行尾空格的功能,如果習慣養成不好,可臨時使用它,避免多余空格產生;
- 每段較大的程序體,上、下應當加入空白行,兩個程序塊之間只使用1個空行,禁止使用多行。
- 程序塊劃分盡量合理,過大或者過小的分割都會影響他人對代碼的閱讀和理解。一般可以以較大函數定義、邏輯結構、功能結構來進行劃分。少于15行的程序塊,可不加上下空白行;
- 說明或顯示部分中,內容如含有中文、數字、英文單詞混雜,應當在數字或者英文單詞的前后加入空格。
函數定義
- 參數的名字和變量的命名規范一致;
- 函數定義中的左小括號,與函數名緊挨,中間無需空格;
- 開始的左大括號與函數定義為同一行,中間加一個空格,不要另起一行;
- 具有默認值的參數應該位于參數列表的后面;
- 函數調用與定義的時候參數與參數之間加入一個空格;
- 必須仔細檢查并切實杜絕函數起始縮進位置與結束縮進位置不同的現象;
引號
- 單引號中,任何變量($var)、特殊轉義字符(如“\t \r \n”等)不會被解析,因此PHP的解析速度更快,轉義字符僅僅支持“\’”和“\\”這樣對單引號和反斜杠本身的轉義;
- 雙引號中,變量(var)值會代入字符串中,特殊轉義字符也會被解析成特定的單個字符,還有一些專門針對上述兩項特性的特殊功能性轉義,例如“\$”和“{var)值會代入字符串中,特殊轉義字符也會被解析成特定的單個字符,還有一些專門針對上述兩項特性的特殊功能性轉義,例如“\$”和“{array[‘key’]}。這樣雖然程序編寫更加方便,但同時PHP的解析也很慢;
- 數組中,如果下標不是整型,而是字符串類型,請務必用單引號將下標括起,正確的寫法為array[‘key′],而不是array[‘key′],而不是array[key],因為不正確的寫法會使PHP解析器認為key是一個常量,進而先判斷常量是否存在,不存在時才以“key”作為下標帶入表達式中,同時出發錯誤事件,產生一條Notice級錯誤。
- 因此,在絕大多數可以使用單引號的場合,禁止使用雙引號。依據上述分析,可以或必須使用單引號的情況包括但不限于下述:
- 字符串為固定值,不包含“\t”等特殊轉義字符;
- 數組的固定下標,例如$array[‘key’];
- 表達式中不需要帶入變量,例如string=‘test′;,而非string=‘test′;,而非string = “test$var”;
- 例外的,在正則表達式(用于preg_系列函數和ereg系列函數)中,Discuz!全部使用雙引號,這是為了人工分析和編寫的方便,并保持正則表達式的統一,減少不必要的分析混淆。
- 數據庫SQL語句中,所有數據必須加單引號,無論數值還是字串,以避免可能的注入漏洞和SQL錯誤。正確的寫法為:
Discuz!語言問題
命名原則
?
變量、對象、函數名
- 變量、對象、函數名一律為小寫格式,除非必要,單詞之間一般不使用下劃線“_”進行分割;
- 以標準計算機英文為藍本,杜絕一切拼音、或拼音英文混雜的命名方式;
- 變量命名只能使用項目中有據可查的英文縮寫方式,例如可以使用data而不可使用data而不可使用data1、data2這樣容易產生混淆的形式,應當使用data2這樣容易產生混淆的形式,應當使用threaddata、$postdata這樣一目了然容易理解的形式;
- 可以合理的對過長的命名進行縮寫,例如bio(bio(biography),tpp(tpp(threadsPerPage),前提是英文中有這樣既有的縮寫形式,或字母符合英文縮寫規范;
- 必須清楚所使用英文單詞的詞性,在權限相關的范圍內,大多使用allow???或allow???或is***的形式,前者后面接動詞,后者后面接形容詞。
常量
- 常量應該總是全部使用大寫字母命名,少數特別必要的情況下,可使用劃線來分隔單詞;
- PHP 的內建值 TRUE、FALSE 和NULL必須全部采用大寫字母書寫。
變量的初始化與邏輯檢查
任何變量在進行累加、直接顯示或存儲前必需進行初使化,例如:
$number = 0; //數值型初始化 $string = ‘’; //字符串初始化 $array = array(); //數組初始化- 判斷一個無法確定(不知道是否已被賦值)的變量時,可用empty()或isset(),而不要直接使用if($switch)的形式,除非你確切的知道此變量一定已經被初始化并賦值。
- bool empty(mixed var)
- bool isset(mixed var[, mixed var[, ...]])
- 如果 var 存在則返回 TRUE,否則返回 FALSE。
- 如果已經使用 unset() 釋放了一個變量之后,它將不再是 isset()。若使用 isset() 測試一個被設置成 NULL 的變量,將返回 FALSE。同時要注意的是一個 NULL 字節("\0")并不等同于 PHP 的 NULL 常數。
- 判斷一個變量是否為數組,請使用is_array(),這種判斷尤其適用于對數組進行遍歷的操作,例如foreach(),因為如果不事先判斷,foreach()會對非數組類型的變量報錯;
- 判斷一個數組元素是否存在,可使用isset($array[‘key’]),也可使用empty(),兩者異同見上。
安全性
兼容性
- 代碼設計應當兼顧PHP 高低版本的特性,當前,應仍然以PHP 4.0.6作為最低通過平臺,盡量不使用高版本PHP 新增的函數、常數或者常量。如果使用只在高版本才具備的函數,必須對其進行二次封裝,自動判斷當前PHP版本,并自行編寫低版本下的兼容代碼;
- 對于個別函數,參數要求或者代碼要求應當以較為嚴格的PHP版本為準;
- 除非必要,不要使用PHP擴展模塊中的函數。使用時應當加入必要的判斷,當服務器環境不支持此函數的時候,進行必要的處理。文檔和程序中的功能說明中,也應加上兼容性說明。
代碼重用
- 在需要多次使用代碼,并且對于您希望實現的任務沒有可用的內置 PHP 函數時,不吝嗇定義函數或類。開發者須根據功能、調用情況,將函數和類放置于相應的function或class中。超過3行,實現相同功能的程序切勿在不同程序中多次出現,這是無法容忍和回避的問題;
- 在任何時候都不要出現同一個程序中出現兩段或更多的相似代碼或相同代碼,即便在不同程序中,也應盡力避免。開發者應當總是有能力找到避免代碼大段(超過10行)重復或類似的情況。
其他細節問題
包含調用
- 包含調用程序文件,請全部使用require_once,以避免可能的重復包含問題;
- 包含調用緩存文件,由于緩存文件無法保證100%正確打開,請使用include_once或include。在必要時,可以使用@include_once或@include的方式,以忽略錯誤提示;
- 包含和調用代碼中,須以“./”或DISCUZ_ROOT.’./’開頭,應避免直接寫程序文件名(例如:require_once ‘x.php’;)的做法;
- 所有被包含和調用的程序文件,包括但不限于程序、緩存或模板,通常其不能被直接URL請求。Discuz!通過在./source/class/class_core.php中定義一個標記性常量IN_DISCUZ,來判斷程序是否被合法調用。因此,在除了./source/class/class_core.php以外的任何一個被包含和調用的程序文件中,需要包含以下內容,以使得訪問者無法直接通過URL請求該文件:
錯誤報告級別
- 在軟件開發和調試階段,請使用error_reporting(E_ALL);作為默認的錯誤報告級別,此級別最為嚴格,能夠報告程序中所有的錯誤、警告和提示信息,以幫助開發者檢查和核對代碼,避免大多數安全性問題和邏輯錯誤、拼寫錯誤。error_reporting()可以在config/config_global.php中添加一行$_config['debug'] = 1;debug值可以在0~2之前取值,數值越大報錯等級越高。
- 在軟件發布時,請使用error_reporting(E_ERROR | E_WARNING | E_PARSE);作為默認的錯誤報告級別,以利于用戶使用并將無謂錯誤提示信息降至最低。
數據庫設計
字段
表和字段命名
- 最常用的核心id,或經常在URL中進行調用的,盡量用簡寫的形式,例如tid、pid、uid;
- 有功能性作用,URL中偶爾用到的id,使用全稱的形式,例如pluginid;
- 沒有功能性作用,只為管理和維護方便而設的id,可以使用全稱的形式,也可只將其命名為id。
所有與表、字段相關的命名,請務必大量參考Discuz!現有字段的命名方式,以保證命名的系統性和統一性。
字段結構
- 允許NULL值的字段,數據庫在進行比較操作時,會先判斷其是否為NULL,非NULL時才進行值的必對。因此基于效率的考慮,所有字段均不能為空,即全部NOT NULL;
- 預計不會存儲非負數的字段,例如各項id、發帖數等,必須設置為UNSIGNED類型。UNSIGNED類型比非UNSIGNED類型所能存儲的正整數范圍大一倍,因此能獲得更大的數值存儲空間;
- 存儲開關、選項數據的字段,通常使用tinyint(1)非UNSIGNED類型,少數情況也可能使用enum()結果集的方式。tinyint作為開關字段時,通常1為打開;0為關閉;-1為特殊數據,例如N/A(不可用);高于1的為特殊結果或開關二進制數組合(詳見Discuz!中相關代碼);
- MEMORY/HEAP類型的表中,要尤其注意規劃節約使用存儲空間,這將節約更多內存。例如cdb_sessions表中,就將IP地址的存儲拆分為4個tinyint(3) UNSIGNED類型的字段,而沒有采用char(15)的方式;
- 任何類型的數據表,字段空間應當本著足夠用,不浪費的原則,數值類型的字段取值范圍見下表:
| 字段類型 | 存儲空間(b) | UNSIGNED | 取值范圍 |
| tinyint | 1 | 否 | -128~127 |
| 是 | 0~255 | ||
| smallint | 2 | 否 | -32768~32767 |
| 是 | 0~65535 | ||
| mediumint | 3 | 否 | -8388608~8388607 |
| 是 | 0~16777215 | ||
| int | 4 | 否 | -2147483648~2147483647 |
| 是 | 0~4294967295 | ||
| bigint | 8 | 否 | -9223372036854775808~9223372036854775807 |
| 是 | 0~18446744073709551615 |
SQL語句
- 所有SQL語句中,除了表名、字段名稱以外,全部語句和函數均需大寫,應當杜絕小寫方式或大小寫混雜的寫法。例如select * from cdb_members;是不符合規范的寫法。
- 很長的SQL語句應當有適當的斷行,依據JOIN、FROM、ORDER BY等關鍵字進行界定。
- 通常情況下,在對多表進行操作時,要根據不同表名稱,對每個表指定一個1~2個字母的縮寫,以利于語句簡潔和可讀性。
性能與效率
定長與變長表
- 對于變長表,由于記錄大小不同,在其上進行許多刪除和更改將會使表中的碎片更多。需要定期運行OPTIMIZE TABLE以保持性能。而定長表就沒有這個問題;
- 如果表中有可變長的字段,將它們轉換為定長字段能夠改進性能,因為定長記錄易于處理。但在試圖這樣做之前,應該考慮下列問題:
- 使用定長列涉及某種折衷。它們更快,但占用的空間更多。char(n) 類型列的每個值總要占用n 個字節(即使空串也是如此),因為在表中存儲時,值的長度不夠將在右邊補空格;
- 而varchar(n)類型的列所占空間較少,因為只給它們分配存儲每個值所需要的空間,每個值再加一個字節用于記錄其長度。因此,如果在char和varchar類型之間進行選擇,需要對時間與空間作出折衷;
- 變長表到定長表的轉換,不能只轉換一個可變長字段,必須對它們全部進行轉換。而且必須使用一個ALTER TABLE語句同時全部轉換,否則轉換將不起作用;
- 有時不能使用定長類型,即使想這樣做也不行。例如對于比255字符更長的串,沒有定長類型;
- 在設計表結構時如果能夠使用定長數據類型盡量用定長的,因為定長表的查詢、檢索、更新速度都很快。必要時可以把部分關鍵的、承擔頻繁訪問的表拆分,例如定長數據一個表,非定長數據一個表。例如Discuz!的cdb_members和cdb_memberfields表、cdb_forums和cdb_forumfields表等。因此規劃數據結構時需要進行全局考慮;
進行表結構設計時,應當做到恰到好處,反復推敲,從而實現最優的數據存儲體系。
運算與檢索
- 數值運算一般比字符串運算更快。例如比較運算,可在單一運算中對數進行比較。而串運算涉及幾個逐字節的比較,如果串更長的話,這種比較還要多。
- 如果串列的值數目有限,應該利用普通整型或emum類型來獲得數值運算的優越性。
- 更小的字段類型永遠比更大的字段類型處理要快得多。對于字符串,其處理時間與串長度直接相關。一般情況下,較小的表處理更快。對于定長表,應該選擇最小的類型,只要能存儲所需范圍的值即可。例如,如果mediumint夠用,就不要選擇bigint。對于可變長類型,也仍然能夠節省空間。一個TEXT 類型的值用2 字節記錄值的長度,而一個LONGTEXT 則用4字節記錄其值的長度。如果存儲的值長度永遠不會超過64KB,使用TEXT 將使每個值節省2字節。
結構優化與索引優化
- 寫操作多的,通常可使用寫入緩存的方法,先將需要寫或需要更新的數據緩存至文件或其他表,定期對大表進行批量寫操作,例如Discuz!中點擊數延遲更新機制,就是依據此原理實現。同時,應盡量使得常被讀寫的大表為定長類型,即便原本的結構中大表并非定長。大表定長化,可以通過改變數據存儲結構和數據讀取方式,將一個大表拆成一個讀寫多的定長表,和一個讀多寫少的變長表來實現;
- 讀操作多的,需要依據SQL查詢頻率設置專門針對高頻SQL語句的索引和聯合索引。
查詢優化
| 字段a | 字段b | 字段c |
| 1 | 7 | 11 |
| 2 | 8 | 10 |
| 3 | 9 | 13 |
| 最優條件:b<’1’ AND a>’0’ 最優索引:INDEX abc (b, a, c) 原因:b<’1’作為第一條件可以先過濾掉75%的結果。如果以a>’0’作為第一條件,則只能先過濾掉25%的結果
| ||
兼容性問題
- 由于MySQL 3.23至5.0的變化很大,因此程序中盡量不使用特殊的SQL語句,以免帶來兼容性問題,并給數據庫移植造成困難。
- 通常在MySQL 4.1以上版本,Discuz!應使用相當的字符集來存儲,例如GBK/BIG5/UTF-8。傳統的latin1編碼雖然有一定的兼容性,但仍然不是推薦的選擇。使用相應非默認字符集時,程序每次運行時需要使用SET NAMES ‘character_set’;來規定連接、傳輸和結果的字符集。
- Mysql 5.0以上新增了數種SQL_MODE,默認的SQL_MODE依服務器安裝設置不同而不同,因此程序每次運行時需要使用SET SQL_MODE=’’;來規定當前的SQL模式。
模板設計
代碼標記
書寫規則
HTML
、<input …/>,<input /> 標記的屬性必須按照以下順序書寫:<input type="" name="" id="" class="" … />
變量
- 邏輯體中,即被包圍起來的部分,例如這種形式,其中的變量書寫規范與PHP程序中完全一致;
- 模板內容中,即未被包圍起來的部分,與PHP程序中最大的不同是,對數組字符串類型下標無需加入單引號,因為Discuz!模板編譯器會在對模板進行編譯時將這部分的單引號自動加入。
- 變量前后含有中括號的或其他敏感字符的(包括但不限于“”、“’”等),正確的寫法為descriptionnew[{”、“’”等),正確的寫法為descriptionnew[{buddy[buddyid]}];
- 數組的下標為變量的,正確的寫法為{extcredits[extcredits[creditstrans][title]};
- 其他變量十分復雜的情況。
語言元素
縮進
文件與目錄
文件命名
- 以小寫lang_xxxx.php格式命名,只能存放模板或程序使用的語言包信息。
- 模板語言包存放在對應模塊名下的lang_template.php,例如:家園的模板語言包source\language\home\lang_template.php
目錄命名
- Discuz!目錄命名以前面《4.4命名原則》的約定為基本準則。在可能的情況下,多以復數形式出現,如./templates、./images等。
- 由于目錄數量較少,因此目錄命名大多是一些習慣和約定俗成,開發人員如需新建目錄,應與項目組成員進行磋商,達成一致后方可實施。
空目錄索引
- 請在所有不包含普通程序(即能夠被URL直接調用的程序)的目錄中放置一個1字節的index.htm文件,內容為一個空格。幾乎除Discuz!根目錄以外,所有目錄都屬于這一類型,因此開發者需要在這些目錄全部放入空index.htm文件,以避免當http服務器的Directory Listing打開時,服務器文件被索引和列表。
- 附件目錄等敏感目錄,要在程序中實現相應功能,當新建下級目錄時,必須自動寫入一個空的index.htm文件,以避免新建目錄被索引的問題。
總結
以上是生活随笔為你收集整理的Discuz代码研究-编码规范的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: intersection(说一说inte
- 下一篇: 回归方程(说一说回归方程的简介)