Uniprot Accession的格式以及正则表达式

Uniprot Accession

Uniprot accession是稳定的标识符,用于引用UniProtKB条目。在每个条目的数据信息整合到UniProtKB之后,每个条目都被分配了一个唯一的登录号,这个编号叫做“主Accession号”。
UniProtKB的登录号由6个或10个字母数字字符组成,其格式有以下三种pattern,请点击这里查看
这三种模式可以组合成以下的正则表达式:
[OPQ][0-9][A-Z0-9]{3}[0-9]|[A-NR-Z][0-9]([A-Z][A-Z0-9]{2}[0-9]){1,2}
Examples: A2BC19, P12345, A0A022YWF9

条目可以有多个登录号。这可能是由于两个不同的原因造成的:
a)当两个或两个以上的条目合并时,保留所有条目的登录号。第一个登录号称为“主(可供引用的)登录号”,其他的称为“第二登录号”。这些是按字母数字顺序列出的。
b)如果一个现有的条目被分割成两个或多个条目(‘demerged’),新的‘primary’登录号归属于所有分割的条目,而所有原始登录号保留为‘secondary’登录号。
Example: P29358 which has been ‘demerged’ into P68250 and P68251.

建议,在任何引用和链接中都应该使用条目的主登录号,因为它是条目唯一稳定的标识符。

致谢:
参考翻译来源

相关推荐