כיצד לקבוע את תוכן ה- GC של רצף DNA?

Input = argv רצף = "" רצף = init (רצף) הדפס "% 0,2f"% (float (GCcontent (רצף)) / len (רצף))
Def main (): script, input = argv רצף = "" רצף = init (רצף) הדפס "% 0,2f"% (float (GCcontent (רצף)) / len (רצף)).

תוכן הגואנין-ציטוזין, או תוכן ה- GC, ברצף ה- DNA מציין את אחוז זוגות בסיס הנוקליאוטידים בהם קושר הגואנין לציטוזין. יהיה קשה יותר לפרק DNA עם תוכן GC גבוה יותר.

שיטה 1 מתוך 2: ביד

  1. 1
    עקוב אחר הרצף וציין את מספר הנוקלאוטידים של ציטוזין (C) או גואנין (G).
  2. 2
    חלק את מספר הציטוזינים והנוקלאוטידים הגואנינים במספר הזוגות הבסיסי ברצף.

שיטה 2 מתוך 2: באופן פרוגרמטי (פיתון 2)

  1. 1
    צור או קבל קובץ קלט. מאמר זה מניח שהקלט הוא בפורמט FASTA, עם רצף יחיד לכל קובץ.
  2. 2
    קרא בתיק. לפורמט FASTA:
    • מחק את השורה הראשונה בקובץ.
    • הסר את כל הקווים החדשים שנותרו ואת המרחב הלבן הנגרר האחר.
    def init (רצף): עם open (argv [1]) כקלט: רצף = "". להצטרף ([line.strip () לשורה ב input.readlines () [1:]]) רצף החזרה 
    חלק את מספר הציטוזינים והנוקלאוטידים הגואנינים במספר הזוגות הבסיסי ברצף
    חלק את מספר הציטוזינים והנוקלאוטידים הגואנינים במספר הזוגות הבסיסי ברצף.
  3. 3
    צור דלפק. חזרו דרך הנתונים והגדלו את הדלפק שלכם כשאתם נתקלים בכל נוקלאוטידים של גואנין או ציטוזין.
    4
    def GCcontent (רצף): GCcount = 0 לאות ברצף: אם אות == "G" או אות == "C": GCcount + = 1 חזרה GCcount 
  4. 5
    חלק את ספירת ה- GC לפי האורך הכולל של הרצף, והפק את התוצאה בפורמט אחוז.
    6
    def main (): script, input = argv רצף = "" רצף = init (רצף) הדפס "% 0,2f"% (float (GCcontent (רצף)) / len (רצף)) 

טיפים

  • אם אתה מחשב תוכן GC באופן ידני, הקפד לבדוק שוב! זה יכול להיות קל לספור לא נכון, במיוחד אם אתה מנתח רצף ארוך על הנייר.

FacebookTwitterInstagramPinterestLinkedInGoogle+YoutubeRedditDribbbleBehanceGithubCodePenWhatsappEmail